arXivがCHAPプロトコルを提案、人間とエージェントの協調作業を構造化

arXivは6月8日(現地時間)、cs.AIカテゴリで「Collaborative Human-Agent Protocol (CHAP)」と題された論文を公開した。ファウンデーションモデルが応答生成から運用的な役割へと移行する中、本プロトコルは複数の人間とエージェントが連携して責任ある作業を行うための技術的枠組みを提案する。共有ワークスペースの定義と人間による判断の記録方法の標準化を通じて、複合的な協調作業における技術的側面を明確にすることを目指す。

ファウンデーションモデルは現在、単なる応答の生成に留まらず、多段階の計画立案、ツールの呼び出し、人間からの入力要求、他のエージェントとの連携といった運用的な役割を担う。これにより、顧客、クレーム、コード、契約、臨床的決定に影響を及ぼす作業において、モデルが責任を持つ場面が増加している。

従来のシステムでは、一人の人間が一つのモデルを監督する形態が主流であった。しかし現状は、複数の人間と複数のエージェントがチーム、タイムゾーン、信頼の境界を越えて協調する体制へと変化している。このような複合的な協調作業を支える技術的側面は十分に明確化されていなかった。特に、エージェントが作成したドラフトを人間が編集する際の「人間の判断」は、システム内で最も価値のあるシグナルであるにもかかわらず、その記録はアプリケーションコード、チャットスレッド、チケットコメント、あるいは集合的な記憶の中に散逸しているのが現状である。

既存のプロトコル標準としては、エージェントのツールとデータへのアクセスを標準化するMCPや、エージェント間の相互運用性を標準化するA2Aが存在する。しかし、これらの標準はいずれも、人間とエージェントが説明責任を持って協働するための共有ワークスペースを定義していないと指摘されている。

本論文が提示するCHAPは、この未定義領域に対応するプロトコルである。CHAPの下では、これまでチャットスレッドの中に埋もれがちだったオーバーライド、すなわち人間による介入が、差分（diff）、根拠（rationale）、コンテンツハッシュを含む構造化されたイベントとして記録される。また、シフト間の作業引き継ぎは、固定されたメッセージではなく、移植可能なエンベロープとして扱われる。さらに、エージェントが作成したドラフトに対する人間の承認は、数年後にも再生可能で、否認不能な署名付き決定として残る。

このプロトコルは、ワークスペース、参加者、タスク、成果物、追記専用の証拠ログから構成される「Core」と、レビュー、モード、ルーティング、審議、引き継ぎ、ID、署名、透明性を担保する監査といった要件に応じて追加可能な「構成可能なプロファイル」を通じてこれらの機能を実現する。CHAPの仕様、参照実装、適合性スイート、および機能例が、論文内で提供されている。

参考: arXiv cs.AI — 2026年6月9日 02:11 (JST)