arXivがDeMaVLA発表、変形物体操作のVLA基盤モデルを提案
arXiv cs.ROが2026年5月29日(現地時間)付けで、汎用的な変形物体操作のためのVision-Language-Action (VLA) 基盤モデル「DeMaVLA」に関する論文を公開した。DeMaVLAは、多様な物体や環境下での操作スキル習得を家庭用ロボットに提供することを目指す。既存のシステムが物体カテゴリごとに個別のポリシーを訓練するのに対し、DeMaVLAはVLMバックボーンとアクションエキスパートを組み合わせ、フローマッチングを用いて連続的なアクション生成を定式化する。