xAI は6月3日(現地時間)、画像から映像を生成する新モデル「グロック・イマジン・ビデオ 1.5 プレビュー (grok-imagine-video-1.5-preview)」を同社のエーピーアイ (xAI API) を通じてプレビュー提供を開始したと発表した。このモデルは静止画像をシネマティックな映像に変換し、自然言語による複雑な動きの制御を可能にする。最大720pの解像度で、元の画像の見た目や照明を保持し、細部まで再現された映像生成が特徴。同社はこれに先立ち、5月28日(現地時間)には高速なコーディングモデル「グロック・ビルド 0.1 (Grok Build 0.1)」のパブリックベータ提供も開始しており、グロック (Grok) の能力拡張を加速させている。
グロック・イマジン・ビデオ 1.5 プレビュー (grok-imagine-video-1.5-preview) は、一枚の静止画から滑らかでシネマティックな映像を生成する能力を持つ。ユーザーは、開始フレームとなる静止画像と、カメラの動き、雰囲気、物理現象を含むシーン全体のアニメーションを記述する自然言語プロンプトを指定することで、直感的に映像コンテンツを制作できる。このモデルは入力フレームの詳細と照明を極めて高い精度で保持し、元の画像を再解釈することなく、リアルで連続性のある映像を出力することが可能だ。生成される映像は最大720pの解像度をサポートし、プロンプトの記述に応じて、ズームイン、パン、回転といったカメラワークや、オブジェクトの複雑な動き、さらには光の揺らぎや煙の拡散といった環境効果まで細かく制御できる。これにより、デジタルコンテンツ制作、広告、教育など多岐にわたる分野での応用が期待される。
また、xAI は、5月28日(現地時間)に高速なコーディングモデルグロック・ビルド 0.1 (Grok Build 0.1)を同社のエーピーアイ (xAI API) でパブリックベータとして提供開始したことを発表している。このモデルは、エージェンティックコーディングタスクに特化して訓練されており、ウェブ開発における複雑なコーディング作業、デバッグ、マイクロソフトシーピーユー (MCP) サポートなど、多岐にわたる開発業務を効率化する。グロック・ビルド 0.1 は、1秒あたり100トークン以上という非常に高速な速度でコードを生成することが可能で、開発者の生産性を飛躍的に向上させるとされる。その高速性と特化された能力により、コーディング以外の汎用エージェンティック用途や、ツール呼び出しを伴う高度なユースケースにも応用可能であり、多様な自動化ソリューションの基盤としての可能性を秘めている。エックスエーアイはこれらの最新モデルを通じて、グロックのマルチモーダル能力と開発支援能力を一層強化し、ユーザーがより高度なタスクを効率的に実行できるよう支援していく方針だ。
参考: releasebot.io (アーカイブ) — 2026年6月4日 09:00 (JST)