Anthropic、Fable 5のサイバー安全対策詳細とジェイルブレーク枠組みを公開
Anthropicは2026年7月2日(現地時間)、AIモデル「Claude Fable 5」のサイバーセキュリティセーフガードに関する詳細情報と、AIジェイルブレークの重症度を評価するための初期ドラフト版フレームワークを発表した。同社はFable 5の再展開に伴い、有害または潜在的に有害なサイバーセキュリティ利用を検出・阻止するAIシステムである安全分類器の具体的な機能と、その設計意図について説明した。この取り組みは、AIモデルの安全対策を迂回する「ジェイルブレーク」への一貫した業界横断的評価基準の確立を目指す。