Amy Xin氏らの研究チームは2026年6月11日(現地時間)、大規模言語モデル(LLM)基盤のエージェントシステム「EurekAgent」に関する論文を発表した。同システムは、自律的な科学的発見において、エージェントのワークフロー設計よりも環境設計が鍵となると提唱。数学、カーネル工学、機械学習のタスクで新たな最先端の結果を達成し、特に26-circle packing問題では総APIコスト11ドル未満で新記録を樹立した。
「EurekAgent」は、LLMを基盤としたエージェントシステムで、メートル駆動型の自律的科学発見のために環境が設計されています。研究チームは、モデルの能力向上に伴い、自律的科学的発見におけるボトルネックが、エージェントのワークフローを規定することから、エージェントの動作を形成するリソース、制約、インターフェースといった「エージェント環境」の設計へと移行していると説明しています。
この概念は「環境工学」(environment engineering)と称され、オープンエンドな探索、体系的な成果物管理、エージェント間の協調といった生産的な行動を増幅させ、報酬ハッキングや高摩擦な人間による監視といった有害な行動を抑制する環境を構築することを目指しています。EurekAgentは、環境を以下の4つの側面で設計しています。
- permissions engineering: 境界のあるエージェント実行と隔離された評価のため。
- artifact engineering: ファイルシステムおよびGitベースの協調のため。
- budget engineering: 予算を考慮した探索のため。
- human-in-the-loop engineering: 人間による容易な監視と介入のため。
EurekAgentは、複数の数学、カーネル工学、機械学習のタスクにおいて、新たな最先端の結果を樹立しました。これには、26-circle packing(26個の円の詰め込み問題)において、総APIコストが11ドル未満で発見された新記録も含まれます。
研究チームは、コードと結果をオープンソース化し、信頼性の高い自律研究エージェント開発のための中心的な研究方向として「環境工学」を提唱しています。
参考: arXiv cs.AI — 2026年6月12日 02:56 (JST)
原文ハイライト"Agent Environment Engineering is All You Need For Autonomous Scientific Discovery"