LG AI Research、7.8B二カ国語言語モデルEXAONE 3.0をオープンソース化: 英語と韓国語で優れた実世界アプリケーションと複雑な推論を実現

EXAONE 3.0の紹介: ビジョンと目的

EXAONE 3.0は、LG AI Researchが開発した言語モデルの進化における重要な節目を示しています。「EXAONE」という名前は「Expert AI for EveryONE」に由来し、専門家レベルのAI機能へのアクセスを民主化するというLG AI Researchのコミットメントを表しています。

このビジョンは、一般の人々や専門家が高度なAIを通じて様々な分野で新たな熟練度を達成できるようにするという広範な目的に沿っています。EXAONE 3.0のリリースは画期的な出来事でした。性能が向上したEXAONE 3.0モデルが導入されたのです。

中でも、優れた性能のために指示調整された78億パラメータのEXAONE-3.0-7.8B-Instructモデルが一般に公開されました。この最先端モデルの1つをオープンソース化するという決定は、グローバルAIコミュニティにおけるイノベーションと協力を促進するというLGの献身を示しています。

効率性の進化: EXAONE 1.0から3.0への進歩

EXAONE 1.0から3.0への道のりは、LG AI Researchの大規模言語モデル開発における興味深い発展を示しています。それは、大幅な技術的進歩と効率性の向上を反映しています。2021年に発表されたEXAONE 1.0は、LGの野心的なAI目標の基礎を築きました。

しかし、EXAONE 2.0で重要な強化が導入されました。性能指標とコスト効率が改善されたのです。最も注目すべき飛躍は、EXAONE 3.0のリリースで起こりました。3年間のAIモデル圧縮技術への注力により、EXAONE 2.0と比較して推論処理時間が56%、コストが72%削減されました。

その結果、最初にリリースされたEXAONE 1.0のコストのわずか6%で動作するモデルが実現しました。これらの改善により、モデルの実世界シナリオへの適用可能性が高まりました。また、高度なAIがより幅広い産業分野に展開される際、よりアクセスしやすく経済的に実現可能になりました。

EXAONE 3.0のアーキテクチャ: 技術の驚異

EXAONE 3.0は、最先端のデコーダーオンリーのトランスフォーマーアーキテクチャに基づいています。このモデルは最大4,096トークンのコンテキスト長をサポートし、回転位置埋め込み(RoPE)とグループ化クエリ注意(GQA)メカニズムを利用しています。

これらのアーキテクチャの選択により、英語と韓国語のテキストを処理・生成する能力が向上しました。LGの二カ国語サポートへの重点が反映されています。EXAONE-3.0-7.8B-Instructモデルのアーキテクチャには、14,336のフィードフォワード次元と32のヘッドを持つ32層が含まれています。

これは、計算効率の必要性と複雑な言語タスクを処理する能力のバランスを取るように設計されています。SwiGLU非線形性と102,400の語彙サイズを組み込むことで、サポートする両言語の複雑なニュアンスを扱えるようになりました。

この二カ国語の習熟度は、英語と韓国語のテキストを効果的に前処理するトークナイザーによってさらにサポートされています。これにより、これらの言語におけるモデルのパフォーマンスが最適化されています。

モデルのトレーニング: 品質とコンプライアンスへの注力

EXAONE 3.0のトレーニングには、いくつかの重要な段階がありました。まず、多様なデータセットでの広範な事前トレーニングから始まりました。このデータセットは、ウェブクロールデータ、公開リソース、内部構築コーパスを含むよう慎重にキュレーションされました。

重点は、今日の法的・倫理的環境で必要不可欠な厳格なデータコンプライアンス基準を遵守しながら、高いデータ品質を維持することでした。モデルは8兆トークンを使用してトレーニングされ、2つの異なるフェーズに分かれていました。

最初のフェーズは一般的な領域知識に焦点を当てました。一方、2番目のフェーズでは、高品質の専門領域データを優先するようにデータ分布を再調整することで、特定の領域におけるモデルの専門知識を磨きました。

このアプローチにより、EXAONE 3.0が一般的なタスクに精通しているだけでなく、専門分野でも優れた性能を発揮することが保証されました。これにより、様々なアプリケーションに対応できる多用途ツールとなりました。

トレーニング後の強化: 微調整と最適化

LG AI Researchは、モデルの指示追従能力をさらに向上させるために、2段階のトレーニング後プロセスを採用しました。最初の段階は教師あり微調整(SFT)で、これは新しいタスクへのモデルの一般化に重要でした。

この段階では、多様なユーザー対話を処理するモデルの能力を向上させるため、幅広い指示タイプの作成に焦点を当てました。2番目の段階である直接選好最適化(DPO)は、フィードバックループを使用してモデルの出力を人間の選好に合わせました。

この段階では、オフラインとオンラインのDPO手法を用いました。これにより、モデルがユーザーの期待に応える応答を生成できるようになり、同時に不適切または偏った出力の可能性を最小限に抑えることができました。

EXAONE 3.0の優れた性能: 英語と韓国語のベンチマークで高評価

EXAONE 3.0 7.8Bは、トップクラスの言語モデルとして浮上し、いくつかの重要なベンチマークで1位を獲得しました。具体的には、英語の実世界ユースケースにおいて、MT-Bench、Arena-Hard-v0.1、WildBench、AlpacaEval 2.0 LCなどのタスクで最高の平均スコアを記録しました。

特に、MT-Benchスコア9.01は同サイズのモデルの中で最高であり、複雑なユーザー対話や実世界のシナリオを扱う卓越した能力を示しています。また、数学能力においても、EXAONE 3.0はGSM8Kベンチマークで2位、MATH Level 5ベンチマークで1位を獲得し、基本的および高度な数学問題を解く能力の高さを示しました。

さらに、コーディングタスクでもHumanEvalベンチマークで1位を獲得し、Pythonプログラムの合成において堅牢な性能を発揮しました。全体として、EXAONE 3.0 7.8Bは一貫して高品質の結果を提供し、ほとんどのカテゴリーで他の最先端モデルを上回る性能を示しました。

これにより、英語における信頼性の高い多用途言語モデルとしての評価を確立しました。韓国語の性能に関しても、EXAONE 3.0 7.8Bは特に複雑な言語タスクの処理においてリーダーとして際立っています。

モデルは、KMMLU、KoBEST、多言語機械読解テストであるBelebeleベンチマークの韓国語サブセットなど、いくつかの専門ベンチマークを用いて評価されました。これらのベンチマークにおいて、EXAONE 3.0は一貫して同サイズの他のモデルを上回る性能を示し、特に韓国語での微妙な理解と文脈的推論を要求するタスクで優れた成績を収めました。

例えば、KoBESTのBoolQ、COPA、WiC、HellaSwag、SentiNegなどのカテゴリーで1位を獲得し、評価されたすべてのモデルの中で最高の平均スコア74.1を達成しました。また、韓国語での多段階推論と理解をテストするために設計されたLogicKorベンチマークでも、EXAONE 3.0は再び優位性を示し、8.77のスコアでトップの座を獲得しました。

これらの結果は、韓国語の処理と理解におけるモデルの卓越した能力を示しており、韓国語圏での一般的および専門的なアプリケーションにおいて貴重なツールとなることを示しています。英語と韓国語の両方のベンチマークで優れた成績を収めたことで、EXAONE 3.0 7.8Bはその二カ国語能力を示すとともに、様々な言語的・計算的課題に対応できる先進的なAIモデルとしての地位を確立しました。

EXAONE 3.0のオープンソース化: 協力に向けた大胆な一歩

EXAONE 3.0の旅における最も重要な側面の1つは、そのオープンソース化です。LG AI Researchが78億パラメータの指示調整モデルを一般に公開するという決定は、AI分野の発展に対する同社のコミットメントを示す素晴らしい例です。

このモデルを非商用および研究目的で利用可能にすることで、LGはAIコミュニティに新しいアプリケーションを探索し、イノベーションを推進し、複雑な課題の解決に協力する力を与えることを目指しています。

EXAONE 3.0のアクセシビリティにより、多様な背景を持つ研究者や開発者が実験し、革新し、AIの継続的な進化に貢献することが可能になります。この動きは、特に二カ国語能力が重要な分野で、新しいアプリケーションの増加につながると期待されています。

多様な産業への応用

EXAONE 3.0は、様々な産業にまたがるアプリケーションを想定して設計されています。AIの強化されたデータ処理能力は、医療分野でより正確な診断ツール、予測分析、個別化医療に活用できます。大量の医療データを迅速かつ正確に処理・分析する能力は、患者ケアに革命をもたらす可能性があります。

金融業界では、AIの高度な分析をリスク評価、不正検出、市場分析に適用できます。大規模データセットのパターンやトレンドを識別するAIの能力は、金融機関により深い洞察を提供できます。

AIの改善されたNLP機能は、メディアやエンターテイメント業界にも大きな影響を与えます。AIはコンテンツ作成の自動化、リアルなシミュレーションの生成、ゲームや仮想環境でのユーザー体験の向上を可能にします。これらの機能は、クリエイティブな専門家に新たな可能性を開きます。

EXAONE 3.0の影響と倫理的考察

EXAONE 3.0のオープンソース化は多くの利点をもたらしますが、同時に責任も伴います。LG AI Researchは、このような強力なモデルを一般に公開することの倫理的・社会的影響に積極的に取り組んでいます。

モデルは、LG AIの倫理原則に準拠していることを確認するために広範なテストを受けています。これには、誤用の防止、バイアスの軽減、ユーザープライバシーの保護が含まれます。

責任あるAI開発へのLGのコミットメントは、モデル開発の各段階に組み込まれた厳格なコンプライアンスプロセスに反映されています。データ収集からモデル展開まで、LG AI Researchは悪用のリスクを最小限に抑え、モデルの出力が倫理基準に沿っていることを確保するための保護措置を実装しています。

結論: AI開発における一里塚

高度なアーキテクチャ、二カ国語能力、様々なタスクにおける堅牢な性能を備えたEXAONE 3.0のリリースは、研究者や開発者にとって強力で価値あるツールとなります。

LG AI Researchがこのモデルをオープンソース化するという決定は、グローバルAIコミュニティにおけるイノベーションと協力を促進するという同社のコミットメントを示す大胆な一歩です。

EXAONE 3.0がオープンソースの世界で旅を始めるにあたり、様々な産業分野で新たな開発やアプリケーションを促進することが期待されています。専門家レベルのAIへのアクセスを民主化するというLG AI Researchのビジョンは、今や誰もがアクセスできる現実となりました。