エージェント型AI、目標達成エネルギー消費の新指標発表

arXiv cs.AIは2026年5月20日(現地時間)、Deepak Panigrahy氏とAakash Tyagi氏がエージェント型AIシステムのエネルギー消費を測る新フレームワーク「A-LEMS」と指標「Energy per Successful Goal (EpG)」を発表したと報じた。EpGは、従来のモデル推論単位ではなく、多段階のオーケストレーションを含むエージェント型システムにおける目標達成にかかる総エネルギーを計測する。これにより、エージェント型AIの実際のエネルギーコストをより正確に評価することが可能になる。

従来のAIエネルギーベンチマークは、単一のモデル呼び出しやトレーニング実行という粒度で消費量を測定していた。しかし、単一のユーザー目標が多段階のオーケストレーション、ツール呼び出し、リトライ、障害回復サイクルを引き起こすエージェント型システムでは、呼び出し回数は実装の詳細であり、推論レベルでの正規化は目標達成のエネルギーコストを正確に表していないとの指摘がある。

A-LEMSは、この課題を解決するため、AIエネルギー会計の単位を「推論あたりのエネルギー」から成功した目標あたりのエネルギー (EpG)へと再定義する。EpGは、成功裏に完了した目標によって正規化され、失敗やリトライを含む全ての実行試行におけるワークフローの総エネルギーを集計する。このフレームワークは、時系列境界モデル、RAPLシグナルをワークフローレベルのエネルギーにマッピングする5層の観測パイプライン、および各測定値をハードウェアと実行時構成に紐づける再現性プロトコルを通じて、エネルギーの帰属を形式化する。

EpGに基づき、研究者らはOrchestration Overhead Index (OOI)を定義した。これは、同一のタスク基準の下での線形実行と比較して、オーケストレーションのエネルギーコストを分離する指標である。

5つの推論タスク群と3つのツール拡張タスク群にわたる実験では、エージェント型ワークフローが線形ベースラインと比較し、成功した目標あたりの平均エネルギーが4.33倍高い結果が示された（888.1ジュールに対し205.3ジュール）。このオーバーヘッドは、推論計算ではなくオーケストレーション構造によって引き起こされている。ツール拡張タスクでは、OOIが1.0倍を下回り、エージェント型実行が線形よりも安価であるという結果も得られ、この指標が固定的な上方バイアスではなくオーケストレーション構造を捕捉していることを示唆している。これらの結果は、「推論あたりのエネルギー」がエージェント型AIには不十分であり、EpGとOOIがオーケストレーション構造がエネルギーコストの主要な決定要因となる正確なベンチマークの測定基盤を提供することを示している。

参考: arXiv cs.AI — 2026年5月25日 13:00 (JST)