Anthropicは2026年5月27日(現地時間)、大規模言語モデルの最新版「Claude Opus 4.8」を発表した。このモデルは、コーディング、AIエージェント、およびプロフェッショナルワークにおける性能強化を特徴とし、1M(100万)コンテキストウィンドウを備え、長期間のタスクにおいて一貫性と自律性を維持するよう設計されている。Opus 4.8は、ビジネスユーザーおよび消費者向けにはClaudeのPro、Max、Team、Enterpriseプランで提供され、開発者向けにはClaude Platform、Amazon Web Services、Google Cloud、Microsoft Foundryを通じて利用可能となる。価格は入力トークン100万あたり5ドル、出力トークン100万あたり25ドルから設定されている。

Claude Opus 4.8は、従来のモデルでは処理困難だったタスクや、特に性能が重視される用途向けに構築されたプレミアムモデルと位置づけられている。主なユースケースとして、プロフェッショナルなソフトウェアエンジニアリング、複雑なエージェントワークフロー、および高負荷なエンタープライズタスクが挙げられる。本モデルは「適応的思考」機能を持ち、タスクの複雑さに応じて思考量を自動的に調整する。これにより、難しい問題にはより多くの時間をかけ、単純な問題には迅速に対応する。

高度なコーディングでは、最小限の監視で本番環境に対応するコードを提供し、大規模なコードベースでも信頼性の高い運用を可能にする。AIエージェントの分野では、複雑なマルチツールタスクを一貫した信頼性で調整し、複数のセッションにわたる学習を通じて長期的な作業を推進する。エンタープライズワークフローにおいては、セッション間でコンテキストを維持し、複雑な複数日にわたるプロジェクトをエンドツーエンドで管理できる。

性能ベンチマークに関して、Claude Opus 4.8はコーディング、エージェント、知識ワークの各能力において最先端の性能を発揮する最も能力の高い一般提供モデルである。Super-Agentベンチマークでは、以前のOpusモデルやGPT-5.5をコストパリティで上回る唯一のモデルとして全ケースを完遂した。Legal Agent Benchmarkでは最高スコアを記録し、オールパス基準で初めて10%を突破している。また、Online-Mind2Webでは84%のスコアを達成し、Opus 4.7およびGPT-5.5の両方を大きく上回る性能向上を示した。CursorBenchにおいても、あらゆる努力レベルで以前のOpusモデルを上回っている。米国でのみ推論を実行するワークロード向けには、入出力トークン価格が1.1倍となる米国のみの推論も提供される。


参考: anthropic.com — 2026年5月28日 09:00 (JST)

原文ハイライト

"Claude Opus 4.8 is our most capable generally available model"

この記事をシェア
X はてブ LinkedIn