オープンAI、開発者向けAPIに音声モデル3種を追加、コンテキスト窓128Kに拡張
オープンAI(OpenAI)は5月7日(現地時間)、開発者向けAPIに3種の音声モデルを追加したと発表した。新たに提供されるのは、GPT-5クラスの推論能力を持つリアルタイム音声モデル「GPT-Realtime-2」、70以上の言語を入力として受け付けるリアルタイム多言語変換モデル「GPT-Realtime-Translate」、ストリーミング形式で音声をテキスト化する「GPT-Realtime-Whisper」の3種。いずれも開発者が自然な会話に基づく音声応用システムを構築するための基盤として位置付けられている。