物理AI向けオムニモーダル世界モデル「Cosmos 3」、最先端性能を確立
arxiv.orgは6月1日(現地時間)、物理AI(Physical AI)分野に特化したオムニモーダル世界モデル「Cosmos 3」が発表されたと伝えた。この新モデルは、言語、画像、動画、音声、アクションシーケンスの5つの異なるモダリティを単一の混合トランスフォーマーアーキテクチャで処理・生成可能であり、Physical AIにおける多様な理解および生成タスクにおいて、新たな最先端の性能を達成したと報告されている。
Tag
1 件の関連記事