Hugging Face Blogは2026年6月9日(現地時間)、AIエージェントが二つのHugging Face Spacesを連結し、3Dギャラリーを構築した事例を公開した。このエージェントは、画像生成と3D再構築のSpaceを連携させ、パリのモニュメントを3D Gaussian splatとして表示するウェブサイトを作成。これはマルチメディアソフトウェア構築における「ビルディングブロック経済」の進化を示すものとされている。
Hugging Face Blogは、エージェントがideogram-ai/ideogram4の画像生成SpaceとVAST-AI/TripoSplatの3D Gaussian splat再構築Spaceを組み合わせて、パリのモニュメントを3Dで表現するギャラリーを作成したと発表した。エージェントは、プロンプトに基づいて画像を生成し、その画像を基に3D Gaussian splat (.ply) を再構築。さらに、生成された3Dデータを最適化し (.ksplat)、Three.jsビューアを備えた静的なSpaceとしてデプロイする一連のプロセスを自動で実行した。
このアプローチは、Mitchell Hashimoto氏が提唱する「ビルディングブロック経済」の考え方をマルチメディアAI分野に適用したものとされている。Hugging Face Spacesは、Gradio Spaceが公開するagents.mdファイルを介して、エージェントが呼び出しに必要なAPIスキーマ、エンドポイント、認証情報などを取得できる「ビルディングブロック」として機能する。これにより、エージェントはSpace間の連携(チェイニング)を容易に行える。
この手法を用いることで、パリのギャラリーと同様のものを、エジプトや日本など異なるテーマでも迅速に構築することが可能となる。例えばMonuments of Japanでは、東京タワー、姫路城、金閣寺、大阪城、鎌倉大仏、厳島神社鳥居の画像が生成され、それぞれ3D splatに変換されてSpaceとしてデプロイされた。プロンプトの変更のみで新たなマルチメディアアプリケーションの作成コストが大幅に削減されるという。
参考: Hugging Face Blog — 2026年6月9日 19:46 (JST)
原文ハイライト"An agent built a 3D Paris gallery from two Hugging Face Spaces."