Anthropicは2026年5月27日(現地時間)、大規模AIモデルの最新版「Claude Opus 4.8」をリリースした。この新バージョンは、ベンチマークテストでの性能向上に加え、コードの品質チェックにおける誠実性が高められている。また、Claude Code向けには数百の並列サブエージェントを実行できる「Dynamic Workflows」が導入され、ユーザーがモデルの思考深さを調整できる「Effort Control」機能も追加された。

Claude Opus 4.8は、前モデルのOpus 4.7を基盤とし、同社の評価では、生成したコードの欠陥を見逃す可能性が約4分の1に減少したと報告されている。加えて、不確実性を示す傾向が強まり、裏付けのない主張をする可能性が低いという。

新機能のDynamic Workflowsは、Claude CodeのEnterprise、Team、Maxプランで利用可能となる。これにより、Claudeは単一セッション内で数百の並列サブエージェントを動かし、コードベース全体にわたる大規模な移行作業などを自動化できるようになった。また、claude.aiおよびCoworkでは、ユーザーがClaudeのタスクに対する「Effort Control」を調整できる機能が追加され、高い設定ではより深く思考し質の高い応答を生成し、低い設定では迅速に応答する。

Opus 4.8の高速モードは、以前のモデルと比較して2.5倍の速度で動作し、利用料金は3分の1に削減された。Messages APIも更新され、messages配列内でシステムエントリを受け入れることが可能になった。

ベンチマーク性能では、Super-Agentベンチマークにおいて既存のOpusモデルやGPT-5.5を上回り、すべてのケースを完了した。Legal Agent Benchmarkでは過去最高スコアを記録し、Online-Mind2WebではOpus 4.7およびGPT-5.5を上回る84%のスコアを達成している。


参考: anthropic.com (アーカイブ) — 2026年5月28日 09:00 (JST)

原文ハイライト

"Opus 4.8’s analysis was consistently higher quality than prior Opus models."

この記事をシェア
X はてブ LinkedIn