XDOFは6月17日(現地時間)、ロボット訓練データインフラ事業の本格化に向けて7000万ドルを調達したと発表した。資金はThrive Capital、Spark Capital、a16z、Lux、WndrCoが出資した。同社は、物理世界で動作するロボットの基盤モデル開発に不可欠な訓練データの不足を解消するため、データパイプライン、収集ツール、アノテーションシステムを構築している。現在、20の顧客と契約を結んでいる。
XDOFは共同創業者兼CEOのフィリップ・ウー (Philipp Wu) 氏、共同創業者兼CTOのフレッド・シェントゥ (Fred Shentu) 氏、共同創業者兼COOのネモ・ジン (Nemo Jin) 氏によって2024年10月に設立され、現在約60名の従業員を擁する。ウー氏は、UC Berkeleyでの博士課程中に大規模なロボット学習用データセットの不足に直面し、これをXDOFの事業機会と捉えた。
既存の言語モデルが大量の公開テキストで訓練されたのに対し、ロボットには物理的な相互作用を捉えるデータが必要となる。こうしたデータは既存ではほとんど存在しないため、XDOFは、物理世界で動作するAI(Physical AI)において、次のボトルネックがモデルやチップではなく、データフィードバックループにあると見ている。
XDOFはUC BerkeleyのAI Research labと提携し、ロボット訓練データの収集物として最大規模とされる「ABC」データセットを公開している。これには130,000のロボット操作軌跡データ、300時間のシミュレーション、100時間の評価データが含まれる。この規模の事前訓練データが学術界に提供されるのは初めてだという。UC Berkeleyの博士課程学生デイビッド・マクアリスター (David McAllister) 氏は、モデルとデータが公開されることで、コミュニティが予期せぬ成果を達成すると述べている。
同社は、データ収集を三段階のピラミッド構造で計画している。最も価値が高いのは展開中のロボットで収集される遠隔操作データ、次にGELLOのような遠隔操作ロボットが収集する汎用データ、そして人間が日常業務を行う中で収集する「エゴセントリック」データであり、そのために独自のウェアラブルセンサーを開発する計画だ。ウー氏によると、大規模なデータ収集・管理・運用には、多くのAIラボが外部委託を望むほどの労力と資本が必要になるという。XDOFという社名は、ロボットが実行できる独立した動きの数を示すロボティクス用語degrees of freedomに由来しており、「無限の自由度」を意味する。
今回の7000万ドルの調達は、急成長するロボット基盤モデル市場において、XDOFがデータインフラ提供者として重要な地位を確立しようとしていることを示す。既存のデータアノテーション企業であるScale AIなどが多岐にわたるAIデータサービスを提供するのに対し、XDOFはロボット特化型データの収集とキュレーションに焦点を当てることで差別化を図る。Physical Intelligenceなどのロボット基盤モデル開発企業が台頭する中、XDOFの大規模なデータ供給能力は、モデル性能の決定的な要因となる可能性が指摘されている。
参考: techcrunch.com — 2026年6月18日 00:00 (JST)