Claw-like AIエージェント向け新セキュリティ評価、最大70%の攻撃成功率を記録
arXiv cs.CRは2026年6月29日(現地時間)、常に稼働し認証情報やツールへ持続的なアクセス権を持つClaw-like AIエージェントのセキュリティに関する研究論文を公開した。システムレベルの責任を担うこれらのエージェントについて、既存ベンチマークでは評価しきれていなかった横断的な障害モードを測定するため、新たなベンチマーク「SafeClawArena」を開発。最大で70%の攻撃成功率を記録し、現在の防御策の不十分さを指摘した。