強力AIモデル「Mythos」評価進展とサイバー脅威、米省庁間の管轄対立

Don't Worry About the Vase (Zvi)は5月13日(現地時間)、最先端AI「フロンティアモデル」のリスク管理と規制体制に関する動向を報じた。特に強力なAIモデル「Mythos」の能力評価が進む中、サイバーセキュリティへの潜在的脅威が浮上。モデルへのアクセス権を巡り、米商務省と情報機関・国家安全保障部門の間で管轄権対立が深まっており、今後のAI開発と規制の方向性に影響を及ぼす可能性がある。

米政府は、壊滅的なリスクが現実のものであることを認識し、最先端のフロンティアモデルのリリース監督において積極的な役割を果たす姿勢を見せている。現在、米商務省は、世界で最も強力なAIモデルへのアクセス権を誰に与えるかを決定する権限を持つとされており、この決定権を巡って情報機関や国家安全保障部門との間で管轄権の対立が生じている。

AIモデルの能力については、「Mythos」が過去のモデルやGPT-5.5と比較してどの程度の性能を持つかに関する複数の新たな報告書が公表された。英国AI安全研究所（UK AISI）の報告では、当初評価された「Mythos Preview」の初期バージョンと最終バージョンとの間に、その能力において大きな隔たりがあることが判明した。また、AIのリスクを研究する非営利組織METRによる評価でも、「Mythos」は特定のタスクにおいて既存のトレンドをわずかに上回る性能を示したことが確認されている。

AIの安全性とリスクを研究する独立機関であるPalisade ResearchのSelfReplicateBenchを用いた評価では、強力な防御を持たない標的にアクセスが与えられた場合、「Mythos」が自己複製チェーンをハッキングする能力が大きく向上していることが示された。これらのモデルには、自律的に動作し、意図的に悪用可能なシステムを標的とし、自己複製を目指すというシステム指示が明示的に与えられたとされている。

Anthropic社のGlasswing責任者であるローガン・グラハム氏は、サイバーセキュリティ研究機関であるXBOWおよび英国AI安全研究所（UK AISI）による2つの独立した評価が、Claude Mythos Previewが自律型サイバーセキュリティ能力において段階的な変化をもたらすことを確認したと述べている。英国AI安全研究所は、Project Glasswingの立ち上げ時に出荷されたモデルをテストし、「Mythos Preview」が同機関の2つのエンドツーエンドサイバーレンジ（そのうちの1つは「Cooling Tower」）を初めてクリアしたモデルであると結論付けた。XBOWも攻撃的セキュリティベンチマークで「Mythos Preview」をテストし、その高い正確性を報告している。

これらの評価結果は、フロンティアAIモデルが持つ潜在的な能力とリスクが、これまで以上に現実的な課題として認識されている状況を示す。特に、自律的な攻撃能力を持つAIモデルの出現は、既存のサイバーセキュリティ対策や規制の枠組みを見直す必要性を提起する可能性がある。米政府省庁間の管轄権争いは、高度なAI技術の適切な監督と安全保障を確保する上での重要な側面となり得ると考えられる。

参考: Don’t Worry About the Vase (Zvi) — 2026年5月14日 05:16 (JST)