ByteDanceは2026年6月23日(現地時間)、北京で開催されたVolcano Engine FORCE Conferenceで、動画生成モデル「Seedance 2.5」を発表した。本モデルはネイティブ4K解像度で30秒間の動画クリップを生成し、最大50のマルチモーダル参照入力を同時に受け付ける。エンタープライズベータ版はすでに提供されており、パブリックローンチは2026年7月上旬を目標としている。

ByteDanceは、Seedance 2.0の後継として、中間バージョン2.1から2.4をスキップし、世代的な飛躍を強調している。Seedance 2.5は、画像、オーディオクリップ、3Dホワイトモデル、スタイル参照など、前身の12から大幅に増加した最大50の参照入力を受け入れる。これにより、テキストプロンプトのみの場合と比較して、スタイル、モーション、コンポジションに対するより詳細な制御が可能となる。

本モデルは、低解像度からのアップスケールではなく、ネイティブで4K解像度を生成する。また、より滑らかなグラデーションとポストプロダクションでのカラーグレーディングの余地を増やす10-bitカラー深度をサポートする。プロンプト順守度は20%向上し、オンディスクのアクションと対応するサウンドエフェクト間のネイティブ同期を生成するため、オーディオは視覚信号と同じ潜在空間内で共同処理される。さらに、新しい3D white-boxプレビュー機能により、クリエイターは高品質レンダリングを行う前に低品質のアニメーションを生成できる。

同社のリャン・ルーボー (Liang Rubo) CEOはカンファレンスで、AIサミットへの登頂が最優先事項であり、同社のモデル・アズ・ア・サービス事業が長期投資に裏打ちされた基盤事業へと進化していると述べた。

競争環境において、OpenAIはSoraを3月に停止した。GoogleのVeo 3.1はネイティブ4K出力、オーディオ生成、およびスタイル制御のための最大3つの参照画像を提供しているが、Seedance 2.5の50入力はVeoの3入力を大幅に上回る。一方、ByteDanceはSeedance 2.0がDisney、Warner Bros Discovery、Paramount、Netflixからの停止命令書を受けた後、水透かしとIPガードレールを追加せざるを得なかった経緯がある。Tom CruiseとBrad PittのディープフェイクがMotion Picture Associationから正式な苦情を受け、SAG-AFTRAからも非難されたことで、ByteDanceは3月中旬にグローバル展開を一時停止し、顔ブロックフィルター、C2PAウォーターマーク、および著作権文字検出を導入して3月下旬にCapCutを通じて再開した。新モデルの米国での提供時期は示されていない。著作権問題を再燃させることなくグローバル市場に展開できるかが、中心的な課題となる。


参考: thenextweb.com — 2026年6月23日 20:10 (JST)

原文ハイライト

"the model accepts up to 50 multimodal inputs"

この記事をシェア
X はてブ LinkedIn