OpenAIが新たに音声と翻訳のAIモデルを発表
2026年5月7日、米国のAI企業OpenAIが「Realtime API」向けに新しい音声モデルを3種類公開しました。これにより、リアルタイムでの音声対話や翻訳、文字起こしがさらに進化することが期待されています。
公開されたモデル
- GPT-Realtime-2
- GPT-Realtime-Translate
- GPT-Realtime-Whisper
API料金
新しいモデルの利用には以下の料金が設定されています:
- GPT-Realtime-2:音声入力は100万トークンあたり32ドル、音声出力は100万トークンあたり64ドル。
- GPT-Realtime-Translate:1分あたり0.034ドル。
- GPT-Realtime-Whisper:1分あたり0.017ドル。
まとめ
OpenAIの新しい音声モデルは、リアルタイムでのコミュニケーションを大幅に向上させる可能性を秘めています。特に、GPT-Realtime-Translateは、異なる言語を話す人々の間でのコミュニケーションを円滑にし、ビジネスや教育の現場での利用が期待されます。これらの技術は、今後のAIの進化において重要な役割を果たすことでしょう。