Luma AIが「Uni-1」を発表
2026年3月5日、Luma AIは新しい統合推論画像モデル「Uni-1」を発表しました。このモデルは、オーディオ、ビデオ、画像、言語、空間推論の5つの領域で訓練されており、さまざまなメディアを統合的に扱う能力を持っています。
Uni-1の技術的特徴
Uni-1は、decoder-only autoregressive Transformerアーキテクチャを採用しており、言語と画像のトークンをインターリーブした共有トークンスペースで動作します。これにより、言語で考えながらピクセルや画像を想像・レンダリングすることが可能になります。Luma AIのCEO兼共同創業者であるAmit Jain氏は、これを「intelligence in pixels」と表現しています。
Luma Agentsとの連携
同日、Luma AIは「Luma Agents」も発表しました。これは、テキスト、画像、ビデオ、オーディオのエンドツーエンドのクリエイティブ作業を処理するためのツールです。Luma Agentsは持続的なコンテキストを維持し、出力の自己批判による反復で評価・改善を行うことができます。これにより、ユーザーはより高品質なコンテンツを生成することが期待されます。
まとめ
Luma AIの新しい「Uni-1」モデルは、さまざまなメディアを統合的に扱う能力を持ち、クリエイティブな作業を効率化する可能性を秘めています。今後の展開に注目が集まります。