Chen Huang氏、Yuhao Wu氏、Wenxuan Zhang氏らは6月3日(現地時間)、大規模言語モデル(LLM)を基盤としたマルチエージェントシステム(MAS)において課題となっていたエージェント間通信の非効率性を解決する新たなプロトコル「PACT(Protocolized Action-state Communication and Transmission)」を開発・発表した。このプロトコルは、エージェントの出力情報をコンパクトな行動状態記録に変換することで、トークン使用量を大幅に削減。これにより、システム性能を維持しつつ推論コストを低減し、既存の課題となっていたトレードオフを改善する。
大規模言語モデル(LLM)を基盤とするマルチエージェントシステム(MAS)では、エージェント間の通信が無制約な自然言語で行われることが多い。この自由形式の通信は、トークン使用量を急速に増大させ、共有されるコンテキストウィンドウを消費する。その結果、システムの性能と推論コストの両方に悪影響を及ぼす点が、MASにおける主要な課題として指摘されてきた。
研究チームは、2つのMASトポロジーにおいて5つの一般的なエージェント間通信戦略を詳細に分析した。この分析により、特定の固定された通信戦略が常に最適ではないことが明らかになった。さらに、効果的なエージェント間メッセージは、後続のエージェントが必要とする「行動中心の情報」を一貫して保持することが重要であるとの知見を得た。
これらの分析結果に基づき提案されたPACTは、エージェント間の通信を「公開状態更新問題」として捉え、各エージェントの生出力を、共有履歴に入る前にコンパクトな行動状態記録に変換(投影)する。このアプローチにより、エージェントは無駄な情報を含まず、効率的な状態更新のみを共有することが可能となる。
PACTアプローチの導入により、異なるMASトポロジーにおいて、システム性能とコストのトレードオフが一貫して改善されることが確認された。具体的には、実質的に少ないトークン使用量で、同等またはそれ以上のタスク性能を達成することが可能となる。PACTの利点は、実際のコーディングハーネスであるOpenHandsやSWE-agentといった環境にも適用されている。
OpenHandsにおいてPACTは、解決率を維持したまま、解決あたりのトークン数を約10%削減した。また、SWE-agentでは、入力トークンを半減させつつ、タスクの解決率を維持することに成功している。これらの成果は、PACTがLLMベースのMASにおける通信効率を大幅に向上させ、実用的な応用においてもその有効性を示すものとなっている。
参考: arXiv cs.AI — 2026年6月6日 13:00 (JST)
原文ハイライト"What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems"