ベンダー・製品

【速報】Hugging Face、AIエージェントによる3Dギャラリー構築を発表

Hugging Face Blogは2026年6月9日(現地時間)、AIエージェントが二つのHugging Face Spacesを連結し、3Dギャラリーを構築した事例を公開した。このエージェントは、画像生成と3D再構築のSpaceを連携させ、パリのモニュメントを3D Gaussian splatとして表示するウェブサイトを作成。これはマルチメディアソフトウェア構築における「ビルディングブロック経済」の進化を示すものとされている。

ベンダー・製品

ハギングフェイスブログ、AIモデル経済シミュレーションの創発と制御検証

ハギングフェイスブログ (Hugging Face Blog) は2026年6月8日(現地時間)付けの報告で、ビルド・スモール・ハッカソン (Build Small Hackathon) におけるAIエージェント経済シミュレーションの分析結果を報じた。複数の異なる小規模AIモデルで構成されるエージェント集団を導入したところ、単一モデルでは発生した市場の暴落現象が再現されなくなったことが判明。同報告は、エージェントの自律的な選択が市場挙動を決定する創発性とその制御の難しさを明らかにし、エージェントベース経済モデル構築における重要な知見を提供している。

ポッドキャスト・動画

Latent Space、Andon LabsによるAI現実世界評価を特集

テック業界のPodcast「Latent Space」が2026年6月3日(現地時間)に公開したエピソードで、Andon Labsの共同創業者であるLukas Petersson氏とAxel Backlund氏が、AIエージェントの現実世界における評価手法について解説した。従来のベンチマークが捉えきれない、AIモデルがビジネスを運営する中で示す予期せぬ行動や課題に焦点を当て、同社が開発した「Vending-Bench」やAI運営の実店舗「Andon Market」などの評価事例を紹介した。

ベンダー・製品

エンダバ、OpenAIをAI基盤に採用 ソフトウェアデリバリーを加速

グローバルなテクノロジーサービス企業エンダバ (Endava) は2026年6月4日(現地時間)、OpenAIをエンタープライズAIプラットフォームに採用し、ソフトウェアデリバリーの加速と組織全体のAI活用推進を発表した。同社はChatGPT EnterpriseおよびCodexを従業員に提供。CTOのマシュー・クローク氏は、AI導入は単なるツール追加に留まらず、ワークフローやリーダーシップの行動、チーム間の協業を再考する必要があると強調した。

ポッドキャスト・動画

NVIDIA、Cosmos 3とNemotron 3 Ultraを発表、RTX Sparkもプレビュー

NVIDIAは2026年6月1日(現地時間)、AIモデル「NVIDIA Cosmos 3」および「Nemotron 3 Ultra」の発表に加え、パーソナルコンピュータ向けのスーパーチップ「RTX Spark」をプレビューした。Cosmos 3は言語、画像、動画、音声、アクションを統合するオープンウェイトモデルであり、Nemotron 3 Ultraは550B-A55BのオープンウェイトLLMとして提供される。

ポッドキャスト・動画

Daytona、AIエージェント向けコンピューティング市場の成長を語る

ポッドキャスト「Latent Space」が2026年5月20日(現地時間)付けで報じたところによると、AIインフラ企業Daytonaのイヴァン・ブラジン (Ivan Burazin) CEOは、AIエージェント向けのコンピューティング市場の成長について言及した。同社は月間成長率74%、1日あたり85万回のサンドボックス実行を記録している。ブラジン氏は、エージェントは従来のコード実行環境だけでなく、ステートフルで動的なリソースを持つ「構成可能なコンピューター」を必要としているとの見方を示した。

ポッドキャスト・動画

Anthropicエンジニア、「HTMLは新Markdown」提唱 AI連携に

Lenny's Newsletter(レニーズ・ニュースレター)は2026年5月18日(現地時間)、米AIスタートアップAnthropic(アンソロピック)のClaude Code(クロード・コード)チームに所属するエンジニア、タリク・シヒパー氏が、AIエージェントとのコミュニケーションにおいてHTMLがMarkdown(マークダウン)に代わる優れたフォーマットであると説明したと報じた。シヒパー氏は、HTMLの成果物を通じてプロジェクト計画の策定、インタラクティブな仕様作成、使い捨てマイクロアプリの構築、リビングデザインシステムの維持を実施していると述べた。この手法により、AIエージェントの作業効率を高めつつ、人間の適切な関与を維持できると指摘する。

リサーチ・論文

AIエージェント設計の新分類枠組み、認知機能と実行トポロジーで包括

arXiv cs.AIは2026年3月16日(現地時間)、AIエージェントのアーキテクチャ設計パターンを分類する新たな2次元フレームワークを発表した。これまでの研究が実行トポロジーまたは認知機能のいずれかに偏っていた課題を克服し、両軸を統合。認知機能軸の7カテゴリと実行トポロジー軸の6構造アーキタイプを組み合わせた7x6行列により、27の命名済みパターン(うち13は新名称)を特定し、設計判断と障害分析を支援する。

リサーチ・論文

AIエージェントの報酬ハッキング脆弱性を自動監査、新システム「BenchJack」開発

Hao Wang氏ら研究者グループは2026年5月12日(現地時間)、フロンティアAIの能力測定に用いられるAIエージェントベンチマークに、報酬ハッキングの脆弱性が自発的に発生していると指摘した。この脆弱性を体系的に監査するため、研究チームは自動レッドチーミングシステム「BenchJack(ベンチジャック)」を開発。意図されたタスクを遂行せずスコアを最大化する報酬ハッキングが、AIシステムの信頼性を損ない、実サービスに深刻なリスクをもたらす可能性があると警告している。

リサーチ・論文

グーグル研究者、AIエージェント堅牢化へ「ワークフローストア」構想を発表

Googleの研究者らは5月11日(現地時間)、AIエージェントが即興で動作する「on-the-fly」手法が持つ信頼性・セキュリティの課題を指摘し、ソフトウェアエンジニアリング(SE)プロセスを統合する新構想「AIワークフローストア」を発表した。これは、即興的なエージェントの動作が不確実なプロトタイプを生み出す可能性があり、より堅牢で決定論的に制約されたワークフローへの転換が必要であると提唱するもの。詳細は同日付でarXiv cs.CRに掲載された論文で示された。