AINEWS

Google、AIの新モデル「Gemini 3.1 Flash-Lite」を発表 - 低コストで高速な性能を実現

💡 Googleが新しいAIモデル「Gemini 3.1 Flash-Lite」を発表。高速かつコストパフォーマンスに優れた性能が特徴。

Googleが新AIモデル「Gemini 3.1 Flash-Lite」を発表

2026年3月3日(現地時間)、Googleは新たなAIモデル「Gemini 3.1 Flash-Lite」を発表しました。このモデルは、Gemini 3シリーズの中で最も高速かつコストパフォーマンスに優れた軽量版として位置づけられています。日本では3月4日の朝にこのニュースが報じられ、多くの関心を集めています。

ニュースの要点

  • 発表日: 2026年3月3日(現地時間)
  • プレビュー提供: AI StudioのGemini APIを通じて開発者向け、Vertex AIを通じて企業向けに提供されます。
  • 価格設定: 入力トークン100万個あたり0.25ドル、出力トークン100万個あたり1.50ドル。
  • 性能向上: 前世代のGemini 2.5 Flashと比べ、初回応答時間は2.5倍高速、出力速度は45%向上しています。

技術的な背景

「Gemini 3.1 Flash-Lite」は、基盤となるGemini 3 Proの技術を活用しており、推論能力とマルチモーダル理解(テキスト・画像など)で優れた性能を発揮します。具体的なベンチマークスコアは以下の通りです。
  • Arena.ai Eloスコア: 1432
  • GPQA Diamond: 86.9%
  • MMMU Pro: 76.8%
これらのスコアは、Gemini 2.5 Flashを上回るものであり、高度な処理能力を証明しています。

新機能と利点

新たに追加された「thinking levels」機能により、推論の深さをコントロールできるようになりました。これにより、高頻度のタスク(例: 翻訳、コンテンツモデレーション)やリアルタイム処理が可能になります。また、コンテキストウィンドウの入力トークンは最大1M、出力は64Kトークンに対応しており、多言語・マルチモーダル環境での利用が期待されています。

業界への影響

「Gemini 3.1 Flash-Lite」の登場は、低遅延・低コストで高性能なAIソリューションを求める開発者や企業にとって大きな転機となるでしょう。これにより、スケーラブルなAI導入が可能になり、コストを重視したアプリケーション(例: リアルタイムダッシュボード等)の増加が見込まれます。

さらに、初期ユーザーであるLatitudeなどからは、従来の大規模モデルに匹敵する精度が確認されており、自治体向けサービスであるzevoも3月4日より追加費用なしで提供開始されます。これにより、公的業務の効率化が進むことが期待されています。

最新の動向

Google DeepMindは、3月3日にGemini 2.5 Flashとの比較動画を公開しており、Gemini 3.1 Flash-Liteの高精度かつ高速な処理能力を示しています。現時点では、追加の発表はありませんが、プレビュー版のフィードバックによって正式リリースが加速される可能性もあります。

このように、Googleの新しいAIモデルは、開発者や企業にとって新たな可能性を開くものであり、今後の展開に注目が集まります。

📤 この記事をシェア