Bo Shen氏らの研究グループは6月26日(現地時間)、自律エージェント向けの内因性防御アーキテクチャ「エージェントネイティブイミューンシステム (Agent-Native Immune System, ANIS)」を発表した。このシステムは、従来の外部防御メカニズムが抱える実行時ハイジャックに対する脆弱性に対処することを目指す。ANISは、エージェントの認知ループ内に直接組み込まれる生体着想型の防御機構として機能する。

研究者らは、静的なチャットボットから、永続的なメモリ、ツール使用プロトコル、マルチエージェント連携を備えた自律エージェントへの移行が、人工知能 (AI) の脅威ランドスケープを拡大させたと指摘している。既存の防御策では、メモリ汚染、ツールチェーン操作、マルチエージェントプロトコル攻撃による実行時ハイジャックに対してエージェントが脆弱なままであるという認識に基づき、この課題を解消するためにエージェントネイティブイミューンシステム (ANIS) が導入された。

ANISフレームワークは、4つの主要な貢献を提示している。まず、非認知的な物理的・論理的隔離層であるバリア免疫 (Barrier Immunity, L1)を明確に組み込んだ6層のイミューンタワー (Immune Tower, L0-L5)を設計した。次に、エージェントウイルス (Agent Viruses)とエージェントワクチン (Agent Vaccines)の統一分類体系を確立し、表面的な非パラメトリック防御と堅牢なパラメトリックワクチンの間の重要な区別を形式化した。3番目に、新しい脅威に適応する継続免疫学習 (Continual Immune Learning, CIL)を駆動する自己監視メタ認知自動化基盤であるハーネストライアド (Harness Triad, Meta, Self, Auto)を概念化した。最後に、モデルアライメントとエージェント免疫の間の理論的な明確な区別を確立した。アライメントが学習時の静的な「constitutional」な価値基盤を提供するのに対し、ANISは実行時の動的な「law enforcement」メカニズムとして機能すると説明されている。

このエージェント免疫設計パラダイムは、自律AIシステム開発者に対し、設計段階から内部的なセキュリティ機能を統合する可能性を示す。従来の外部からの防御策のみでは不十分であり、エージェント自身の認知プロセスにセキュリティを組み込む発想は、AIシステムのセキュリティ確保におけるアプローチの一つとなる。実用化においては、免疫プロトコルの標準化や自己免疫率 (Autoimmunity Rate)のような新しい評価指標の確立、集合知エコシステム内における病原体とワクチンの共進化ダイナミクスなど、様々な課題への取り組みが挙げられている。


参考: arXiv cs.AI (アーカイブ) — 2026年6月27日 02:08 (JST)

原文ハイライト

"Agent-Native Immune System: Architecture, Taxonomy, and Engineering"

この記事をシェア
X はてブ LinkedIn