xAI は6月16日(現地時間)、動画生成AIモデル「Grok Imagine Video 1.5 (グロック イマジン ビデオ 1.5)」の一般提供を開始した。本モデルは「Image-to-Video Arena (イメージ・トゥ・ビデオ アリーナ)」のリーダーボードで首位を獲得し、OpenAIの「Sora 2 Pro (ソラ 2 プロ)」ティアと比較して約86%低い価格で提供される。利用はImagine API、grok.com、iOSおよびAndroidアプリを通じて可能となる。
Grok Imagine Video 1.5は現在、Image-to-Video Arenaのリーダーボードでトップを維持している。このシステムはチェスのランキングにも使われる「Elo (イロ)」方式を採用したクラウドソーシングの評価システムで、モデルは+52 Eloポイントの改善を記録し、「Sora 2」、GoogleのVeo 3.1 (ヴェオ 3.1)、Seedance 2.0 (シーダンス 2.0)、「Kling (クリング)」を上回っている。ただし、Eloシステムは一般的なプロンプトにおけるユーザー選好度を測るものであり、正確なフレームごとの制御や720pを超える解像度を要求する特定のプロフェッショナルなワークロードに必ずしも最適とは限らない。
Grok Imagine Video 1.5の動きの一貫性は、基盤となる「Aurora (オーロラ)」アーキテクチャによるものである。Auroraはオートレグレッシブな混合エキスパート動画生成エンジンであり、Soraや「Runway (ランウェイ)」などの拡散ベースの競合とは異なり、各フレームを以前の全てのフレームに基づいて順次生成する。この設計により、カメラの動きの清潔さ、被写体位置の安定性、照明遷移の一貫性が実現されている。一方で、同じアーキテクチャが720pの解像度上限の理由でもあり、1080pへのスケーリングは計算上高価になる。xAIは高解像度Pro Modeのロードマップを公表しているが、リリース日は明らかにしていない。
API価格は、480p出力で1秒あたり0.08ドル、720p出力で1秒あたり0.14ドル、つまり720pティアでは1分あたり4.20ドルで提供される。これはSora 2 Proの1024pワイドスクリーンティアが1分あたり30ドルだったのと比較して約86%安価である。GoogleのVeo 3.1 Fast APIは1分あたり9ドル、「Quality」ティアは1分あたり24ドルで提供されている。Grokの全ティアでネイティブの同期オーディオが追加料金なしで含まれる。月間100分のAI動画を生成する中規模クリエイティブスタジオの場合、GrokはSora 2 Proと比較して月間約2,580ドル、Veo 3.1 Qualityと比較して月間約1,980ドルの節約になると見られる。
一般提供と同時に、Grok Video 1.5 Fastもgrok.comおよびiOS/Androidアプリで提供を開始した。この高速版は、6秒の720pクリップを約25秒で生成し、以前のモデルの40秒以上から約40%の改善がみられる。これは、動画生成が中間ステップとなるレイテンシに敏感なパイプラインやエージェントワークフローにおいて、反復的な生成を実用的な範囲に引き上げるものとなる。
参考: techtimes.com (アーカイブ) — 2026年6月18日 23:25 (JST)