ベンダー・製品

IBM Researchが汎用AIエージェント評価の新リーダーボードとフレームワーク発表

IBM Researchは2026年5月17日(現地時間)、汎用人工知能(AI)エージェントシステムの性能と運用コストを比較するためのオープンベンチマーク「The Open Agent Leaderboard」を発表した。このリーダーボードは、単一のモデルではなく、エージェントが利用するツール、処理手順の計画、アクション間の記憶機能、エラー回復能力といったシステム全体を評価対象とする。同時に、評価フレームワーク「Exgentic」と、その方法論および評価結果を詳述した論文も公開され、これらのリソースは直ちに利用可能となっている。

リサーチ・論文

Preping、エージェントのコールドスタート問題を解消し経験不要の記憶構築を実現

Yumin Choi氏、Sangwoo Park氏、Minki Kang氏、Jinheon Baek氏、Sung Ju Hwang氏らの研究チームは5月10日(現地時間)、タスク固有の経験に依存せず、エージェントが手続き的記憶を構築する事前タスク記憶構築フレームワーク「Preping (プレッピング)」を発表した。この新手法は、エージェントが新たな環境へ導入される際に直面する「コールドスタート問題」を劇的に解消し、効率的な実運用への道を開くことを目指す。関連論文はオンライン論文リポジトリのarXiv cs.AIに掲載され、既存の課題に対する革新的な解決策として注目されている。