Anthropicは2026年6月30日(現地時間)、同社ミドルティアモデルの最新版「Claude Sonnet 5」を発表した。前モデルSonnet 4.6の全ベンチマークスコアを上回り、特にエージェント性能と長時間のタスク実行における信頼性が向上したとされている。最上位モデルOpus 4.8と比較しても性能差を縮めつつ、API価格を低く設定することで費用対効果を最適化した。
Claude Sonnet 5は、アンソロピックのモデルラインアップにおいて、廉価版のHaiku 4.5とフラッグシップのOpus 4.8の中間に位置する。2026年2月にリリースされたSonnet 4.6のアップグレード版として提供され、コンテキストを失うことなく長時間のタスクチェーンを実行できる点や、ツール呼び出しが失敗した場合の自己修正能力の向上が特徴である。
エージェントコーディング性能を測るSWE-bench Proベンチマークでは、Sonnet 5が63.2%を記録し、Sonnet 4.6の58.1%を上回った。ただし、Opus 4.8は69.2%で依然としてリードしている。コンピュータ操作能力を示すOSWorld-VerifiedではSonnet 5が81.2%、Terminal-Bench 2.1では80.4%を達成し、いずれもSonnet 4.6を凌駕した。また、GDPval-AA v2ナレッジワークベンチマークでは、Sonnet 5が1,618点でOpus 4.8の1,615点をわずかに上回る結果となった。
API料金は、Sonnet 5の導入価格が入力トークンあたり2ドル、出力トークンあたり10ドル(100万トークンあたり)に設定されており、2026年8月31日まで適用される。その後は標準価格として入力3ドル、出力15ドルとなる。Opus 4.8の料金は入力5ドル、出力25ドルである。Sonnet 5はOpus 4.7で導入された新しいトークナイザーを使用しており、同じテキストがSonnet 4.6と比較して最大1.35倍多くのトークンにマッピングされる可能性がある。
アンソロピックは、開発者向けにSonnet 5をほとんどのエージェントコーディングやツール使用、ナレッジワークタスクに推奨し、Opus 4.8は精度が重要視されるタスクに限定するルーティングポリシーを示唆している。初期アクセスパートナーからは、マルチステップソフトウェアエンジニアリングやブラウンフィールドデバッグ、ビジネス自動化などの具体的なユースケースが報告されている。
参考: marktechpost.com (アーカイブ) — 2026年7月1日 06:37 (JST)