xAI (エックスエーアイ) は2026年5月15日(現地時間)、音声エージェントAPIの「grok-voice-think-fast-1.0」の提供を開始した。また、同社のリリースノートによると、Speech to Text APIとText-to-Speech APIも一般提供されている。

grok-voice-think-fast-1.0は、Voice Agent APIを通じて利用可能となる。Speech to Text APIは25言語での音声のテキスト化に対応し、バッチモードとストリーミングモードを提供する。Text-to-Speech APIはGrok (グロック) を用いて自然な音声生成を行う。

これらの発表は、xAIのAPIに関する最新変更点を伝えるリリースノートに記載されている。同リリースノートでは、その他にも複数の機能更新が報告された。Grok Buildのベータ版提供、短い音声クリップから音声を複製するCustom Voices機能、APIリクエストごとのコストを追跡するCost Tracking機能、およびアップロードされたファイルに有効期限を設定できるFiles API TTL機能などが含まれる。


参考: docs.x.ai — 2026年5月16日 09:00 (JST)

原文ハイライト

"Grok Voice Think Fast 1.0 is available You can now use grok-voice-think-fast-1.0"

この記事をシェア
X はてブ LinkedIn