中国のAIスタートアップから驚異的なモデルが登場しました。MiniMax M2.5はSWE-benchで80.2%を達成しています。しかもClaude Opus 4.6との差はわずか0.6ポイントです。さらにコストは20分の1です。この記事ではMiniMax M2.5の実力を解説します。
MiniMax M2.5のベンチマーク性能
SWE-Bench Verifiedで80.2%は驚異的な数値です。具体的にはClaude Opus 4.6の80.8%に迫る水準です。また、GPT-5.2の80.0%を上回っています。さらにタスク処理時間は平均22.8分です。つまりClaude Opus 4.6の22.9分とほぼ同じ速度です。しかし汎用推論ではClaude Opusに劣る部分もあります。
MiniMax M2.5の圧倒的なコスト効率
入力トークンは100万あたり0.30ドルです。また、出力トークンは100万あたり1.20ドルです。そのためClaude Opus 4.6の約20分の1のコストです。さらに処理速度は毎秒100トークンです。つまり1時間の連続稼働がわずか1ドルです。特にコーディングタスクではコスパが最強です。
Mixture of Expertsアーキテクチャ
M2.5はMoEアーキテクチャを採用しています。具体的には総パラメータ数が2300億です。しかし推論時に活性化されるのは100億パラメータだけです。そのため計算効率が大幅に向上しています。また、この設計がコスト削減の鍵です。さらにオープンソースで公開されています。
MiniMaxの企業背景
MiniMaxは2021年12月に上海で設立されました。特に元SenseTimeの研究者が創業しています。また、AlibabaやTencent、miHoYoなどが出資しています。さらに2026年1月に香港証券取引所に上場しました。加えてTalkieやHailuo AIなどの消費者向け製品も展開しています。
M2.5の強みと弱みの整理
コーディングとエージェント用途に特化した設計です。実際にMiniMax社内の新規コードの80%がM2.5で生成されています。しかし汎用的な推論能力はまだ課題です。たとえばAIME 2025では45%にとどまっています。それでもコスト重視の開発者にとって最有力候補です。このようにM2.5はAI業界の価格破壊者です。