GoogleがGemini 2.5 Proをリリースしました。推論能力に特化した最新のAIモデルです。しかも100万トークンのコンテキストウィンドウを搭載しています。そこで今回は、Gemini 2.5 Proの性能と料金を詳しく解説します。

Gemini 2.5 Proの基本スペック

Gemini 2.5 Proはいわゆる「考えるモデル」です。つまり回答前に思考プロセスを経ます。したがって複雑な問題への精度が高くなります。テキスト、音声、画像、動画、コードに対応しています。

またコンテキストウィンドウは100万トークンです。具体的にはA4用紙約1500ページ分に相当します。さらに200万トークンへの拡大も予定されています。学習データは2025年1月まで対応しています。

ベンチマーク性能

115のAIモデル中インテリジェンスインデックスで上位にランクインしています。また出力速度は149.7トークン/秒です。これは中央値の72.9トークン/秒を大幅に上回ります。

しかし課題もあります。初期応答遅延が36.60秒と長いのです。一方で中央値はわずか1.20秒です。つまり思考計算に時間がかかるのです。それでも推論精度は同価格帯のモデルを上回っています。

料金体系の詳細

入力は100万トークンあたり1.25ドルです。出力は100万トークンあたり10ドルです。ただし200Kトークンを超える場合は2倍になります。またバッチ処理なら約50%の割引が適用されます。

さらに無料の実験枠も用意されています。Gemini Enterpriseプランでは月額30ドルで利用可能です。したがって、個人開発者から企業まで幅広く使える価格設定です。

競合モデルとの料金比較

Grok-4.1は入力0.20ドル、出力0.50ドルと最も安価です。またClaude Haikuは入力1ドル、出力5ドルです。一方GPT-4oは入力5ドル、出力15ドルと高めです。さらにClaude Opusは入力15ドル、出力75ドルと最も高価です。

つまりGemini 2.5 Proはコストパフォーマンスに優れています。特に推論精度を考慮するとバランスの取れた選択肢です。しかし出力が冗長になりやすいという報告もあります。そのため、実際のコストは予想より高くなる可能性があります。

最適な用途と注意点

複雑な推論タスクが必要な場合に最適です。たとえば長文の分析や多段階の論理推論です。またマルチモーダル入力にも対応しているため画像解析にも使えます。

しかしレイテンシー重視のユースケースには不向きです。なぜなら初期応答に時間がかかるからです。加えてコスト制約がある場合はHaikuクラスのモデルが適しています。このようにGemini 2.5 Proは用途を選べば非常に強力なAIモデルなのです。