Anthropic(アンソロピック)は2026年6月9日(現地時間)、新たなモデル分類「Mythos-class」に属する初の一般公開モデル「Claude Fable 5」をリリースしました。同モデルは、エージェントのリアルワールド知識作業を評価するベンチマーク「GDPval-AA」で1932点を獲得し、首位にランクインしたと発表しています。さらに、Artificial Analysis Intelligence Indexでも#1を獲得しており、同社は新たなAI技術の進展を示すものとしています。

Anthropic(アンソロピック)が2026年6月9日(現地時間)に公開した「Claude Fable 5」は、同社が新たに定義したモデル分類「Mythos-class」における最初の一般公開モデルです。このモデルは、既存の「Claude Mythos 5」と同じ基盤モデルを使用しており、その上で潜在的に有害なサイバーセキュリティ、生物学、化学、および蒸留関連のクエリに対して、追加のセキュリティガードレールが施されています。

「Claude Fable 5」は、悪意ある用途を防ぐための堅牢な対策として、特定のクエリに対してフォールバックメカニズムを導入しています。これは、疑わしいまたはフラグが立てられたクエリを、より安全性が確立されたセカンドモデルである「Claude Opus 4.8」に自動的にルーティングする機能です。Anthropic(アンソロピック)は、平均してセッション全体の5%未満でこのフォールバックが発生していると説明しており、これにより安全性と堅牢性を両立させていると見られます。

エージェントのリアルワールド知識作業を評価する主要ベンチマークである「GDPval-AA」において、「Claude Fable 5」は顕著な性能を示しました。同モデルは1932点という高スコアを記録し、ベンチマークで首位を獲得しています。この結果の測定においては、「Claude Opus 4.8」をフォールバックモデルとして設定し、最大努力での適応的推論が用いられました。特にGDPval-AAタスク全体の2%において、「Claude Fable 5」が「Claude Opus 4.8」にフォールバックした上で成果を出している点が指摘されています。この強力なパフォーマンスにより、Anthropic(アンソロピック)のモデルは「GDPval-AA」ベンチマークのトップ4のうち、3つのスポットを占めるに至っています。

また、広範なAIモデルの性能を評価するArtificial Analysis Intelligence Indexにおいても、「Claude Fable 5」は#1のポジションでローンチされました。Artificial Analysisのレポートによれば、Anthropic(アンソロピック)は、他のどのラボの最良モデルよりも約5ポイント先行していると報じられており、これはAI性能における同社の優位性を示すものとして注目されています。これらのベンチマーク結果は、「Mythos-class」という新たなモデル分類が、高度な安全性と優れた性能を両立させることを目指している現状を明確に示唆しています。


参考: artificialanalysis.ai — 2026年6月10日 03:37 (JST)

原文ハイライト

"Claude Fable 5: the first public Mythos-class model"

この記事をシェア
X はてブ LinkedIn