Google I/O 2026での発表
2026年5月19日(現地時間)、Googleは開発者会議「Google I/O 2026」において、動画の生成と編集に特化したAIモデル「Gemini Omni」を発表しました。この新しいAIは、ユーザーがより簡単に高品質な動画コンテンツを作成できるように設計されています。
Gemini Omniの主な機能
会話形式の指示による動画編集
Gemini Omniは、ユーザーが会話形式で指示を出すことで、段階的に動画を編集できる機能を提供します。これにより、専門的な知識がなくても直感的に動画を作成できるようになります。
複数の入力形式に対応
このAIモデルは、画像、テキスト、動画、音声など、さまざまな入力形式を参照することが可能です。これにより、ユーザーは多様な素材を組み合わせて、よりクリエイティブなコンテンツを制作できます。
動画内の要素の変更
Gemini Omniでは、撮影済みの動画内に登場する人物やキャラクター、物体のディテールを変更したり、差し替えたりすることができます。また、カメラアングルの変更やテキスト表示も可能です。これにより、既存の動画を新たな視点で再構築することができます。
コンテンツの信頼性を確保
生成・編集したコンテンツには、電子透かし「SynthID」と「C2PA Content Credentials」が付与されます。これにより、コンテンツの出所や改変履歴を確認できるため、信頼性が向上します。
Gemini Omni Flashの提供開始
同日、Googleは「Gemini Omni Flash」の提供も開始しました。この機能は、Geminiアプリと映像制作ツール「Google Flow」を通じて、AIサブスクリプション「Google AI Plus」「Pro」「Ultra」のユーザー向けに提供されます。また、今週中にはYouTube上でも無料で利用できる予定です。
今後の展望
さらに、GoogleはGemini OmniのAPIを今後提供することも発表しました。これにより、開発者は自らのアプリケーションにGemini Omniの機能を組み込むことができ、さらなる可能性が広がります。
まとめ
Googleの新しいAIモデル「Gemini Omni」は、動画生成と編集のプロセスを大幅に簡素化し、クリエイターにとって強力なツールとなることが期待されています。特に、会話形式での指示や複数の入力形式への対応は、これまでの動画制作の常識を覆す可能性を秘めています。今後の展開に注目が集まります。