Anthropicは2026年5月19日(現地時間)、新しい汎用言語モデル「Claude Mythos Preview」を発表した。このモデルは、コンピュータセキュリティタスクにおいて顕著な能力を持ち、同社はこれを利用して世界の最も重要なソフトウェアを保護する「Project Glasswing」も立ち上げた。
Claude Mythos Previewは、ユーザーの指示の下、主要なオペレーティングシステムおよび主要なウェブブラウザにおけるゼロデイ脆弱性(未発見の脆弱性)の特定と悪用が可能であると報告されている。このモデルが発見する脆弱性は、しばしば微細で検出が困難なものであり、中にはOpenBSDで発見された27年前のバグのように古いものも含まれる。
同モデルは、単純なスタック破壊にとどまらず、複雑なエクスプロイトを構築する能力も示す。例えば、ウェブブラウザにおいて4つの脆弱性を連鎖させ、JITヒープスプレーを記述することでレンダラーおよびOSサンドボックスを回避するエクスプロイトを作成した。また、Linuxなどのオペレーティングシステムでは、微妙な競合状態やKASLRバイパスを利用して自律的にローカル権限昇格エクスプロイトを獲得した。さらに、FreeBSDのNFSサーバー上で、20個のガジェットからなるROPチェーンを複数のパケットに分割し、認証されていないユーザーに完全なルートアクセスを許可するリモートコード実行エクスプロイトを自律的に記述した。
Anthropicの内部評価では、セキュリティに関する正式な訓練を受けていないエンジニアでも、Claude Mythos Previewを利用して一晩でリモートコード実行の脆弱性を発見し、完全に機能するエクスプロイトを作成できたという。また、旧モデルであるOpus 4.6がMozillaのFirefox 147 JavaScriptエンジンで見つかった脆弱性をJavaScriptシェルエクスプロイトに変換する成功率が数百回の試行で2回だったのに対し、Claude Mythos Previewは同じ実験で181回動作するエクスプロイトを開発し、さらに29回レジスタ制御を達成した。
同社は、OSS-Fuzzコーパスから得られた約千のオープンソースリポジトリに対する内部ベンチマークも実施した。Sonnet 4.6およびOpus 4.6がTier 3(深刻なクラッシュ)を1件のみ達成したのに対し、Claude Mythos PreviewはTier 5(完全な制御フローハイジャック)を10件達成した。これらの能力は、モデルのコード、推論、および自律性における一般的な改善の副次的な結果として現れたものであり、明示的に訓練されたものではない。
Anthropicは、Project Glasswingを通じて、このモデルをまず限定された重要な業界パートナーおよびオープンソース開発者に提供する。これは、同様の能力を持つモデルが広く利用可能になる前に、防御側が最も重要なシステムのセキュリティを確保できるようにすることを目的としている。
参考: red.anthropic.com (アーカイブ) — 2026年5月20日 09:00 (JST)
原文ハイライト"Mythos Preview is in a different league."