Alibabaは2026年6月16日(現地時間)、組み込みAI(Embodied AI)向けの基盤モデル群「Qwen-Robot」シリーズを発表した。同シリーズは「Qwen-RobotNav」「Qwen-RobotManip」「Qwen-RobotWorld」の3モデルで構成され、言語と物理的動作の連携を可能にする。同社のQwen teamは、モバイルロボティクスにおける視覚言語能力の拡張や大規模操作学習、将来の状態予測を支える汎用世界モデルを提供し、体化AI分野での存在感を強化している。
Qwen-RobotNavは、制御可能な観測エンコーディングとツールベースのインターフェースを通じて、視覚言語能力をモバイルロボティクスに拡張するモデルである。このモデルは、指示追従、目標指向ナビゲーション、ターゲット追跡、自動運転という4つの主要タスクを単一のフレームワーク内で統合する。
Qwen-RobotManipは、状態-行動空間を標準化し、エンドエフェクタの動きをカメラ座標系における増分ポーズとして表現する。38,100時間以上の完全にオープンソースのデータで訓練されており、複数のロボットプラットフォーム間での大規模な学習をサポートし、幅広い操作能力を実現する。
Qwen-RobotWorldは、汎用世界モデルとして機能し、自然言語のアクションインターフェースを通じて視覚言語理解と将来の状態予測を結びつける。このモデルは、ナビゲーション、運転、操作の各シナリオにおいて、物理的に一貫した将来の結果を予測することができ、単一の世界モデルが多様な組み込みAIタスクにわたって汎化することを可能にする。
今回のAlibabaによるQwen-Robotシリーズの発表は、組み込みAI分野における同社の戦略的な進出を示すものと見られる。同分野では基盤モデルやハードウェア開発が進められており、競争が激化している。Alibabaは、Qwen-Robotシリーズを通じて、物流、製造、サービス業といった産業オートメーションにおけるロボットの自律性向上と実用化加速を目指す可能性が高い。
Qwen-RobotNav、Qwen-RobotManip、Qwen-RobotWorldの各モデルが連携することで、ロボットはより複雑な環境理解、精密な操作、そして予測に基づいた行動選択が可能になると期待される。
参考: technode.com — 2026年6月17日 12:48 (JST)
原文ハイライト"Alibaba unveils Qwen-Robot series with three foundation models for embodied AI"