エージェントAIのセキュリティ評価統一へ「RIFT-Bench」発表
arXiv cs.AIは2026年6月23日(現地時間)、大規模言語モデル (LLMs) を活用したエージェントAIシステムの動的レッドチーム評価に関する論文「リフトベンチ (RIFT-Bench)」を発表した。本研究は、従来のLLMの脆弱性を超える新たな攻撃ベクトルを持つ自律的AIのセキュリティ評価を統一することを目的としている。既存の評価手法が特定のシステムやドメインに限定される課題に対し、グラフ表現駆動型のアプローチを導入し、多様なエージェントアーキテクチャ間での統一的な評価を可能にする。