Google、AIの新モデル「Gemini 3.1 Flash-Lite」を発表 - 低コストで高速な性能を実現

Googleが新AIモデル「Gemini 3.1 Flash-Lite」を発表

2026年3月3日（現地時間）、Googleは新たなAIモデル「Gemini 3.1 Flash-Lite」を発表しました。このモデルは、Gemini 3シリーズの中で最も高速かつコストパフォーマンスに優れた軽量版として位置づけられています。日本では3月4日の朝にこのニュースが報じられ、多くの関心を集めています。

ニュースの要点

発表日: 2026年3月3日（現地時間）
プレビュー提供: AI StudioのGemini APIを通じて開発者向け、Vertex AIを通じて企業向けに提供されます。
価格設定: 入力トークン100万個あたり0.25ドル、出力トークン100万個あたり1.50ドル。
性能向上: 前世代のGemini 2.5 Flashと比べ、初回応答時間は2.5倍高速、出力速度は45%向上しています。

技術的な背景

「Gemini 3.1 Flash-Lite」は、基盤となるGemini 3 Proの技術を活用しており、推論能力とマルチモーダル理解（テキスト・画像など）で優れた性能を発揮します。具体的なベンチマークスコアは以下の通りです。

Arena.ai Eloスコア: 1432
GPQA Diamond: 86.9%
MMMU Pro: 76.8%

これらのスコアは、Gemini 2.5 Flashを上回るものであり、高度な処理能力を証明しています。

新機能と利点

新たに追加された「thinking levels」機能により、推論の深さをコントロールできるようになりました。これにより、高頻度のタスク（例: 翻訳、コンテンツモデレーション）やリアルタイム処理が可能になります。また、コンテキストウィンドウの入力トークンは最大1M、出力は64Kトークンに対応しており、多言語・マルチモーダル環境での利用が期待されています。

業界への影響

「Gemini 3.1 Flash-Lite」の登場は、低遅延・低コストで高性能なAIソリューションを求める開発者や企業にとって大きな転機となるでしょう。これにより、スケーラブルなAI導入が可能になり、コストを重視したアプリケーション（例: リアルタイムダッシュボード等）の増加が見込まれます。

さらに、初期ユーザーであるLatitudeなどからは、従来の大規模モデルに匹敵する精度が確認されており、自治体向けサービスであるzevoも3月4日より追加費用なしで提供開始されます。これにより、公的業務の効率化が進むことが期待されています。

Googleが新AIモデル「Gemini 3.1 Flash-Lite」を発表

ニュースの要点

技術的な背景

新機能と利点

業界への影響

最新の動向