ZhipuのGLM 5.2、コーディングでOpus 4.8に肉薄、コストは5分の1

Zhipu (チープ) は6月中旬、大規模言語モデルGLM 5.2を発表した。このモデルは、Anthropic (アンソロピック) のOpus 4.8に主要なエージェント型ベンチマークで数ポイント差まで迫りながら、API利用コストを約5分の1に抑えている。GLM 5.2は744億パラメータのMixture-of-Expertsモデルであり、MITライセンスでフルウェイトが公開されている。

GLM 5.2は、トークンごとに約400億のパラメータを活性化することで運用コストを低く保ちつつ、より大規模な知識ベースを利用する。APIの入力トークンは100万あたり約1.40ドル、出力トークンは100万あたり約4.40ドルで提供される。これはOpus 4.8の入力約5ドル、出力約25ドルと比較して大幅に低い。GLM 5.2のリリースは、米商務省 (U.S. Commerce Department) がAnthropicにFable 5とMythos 5の無効化を命じ、OpenAIがGPT-5.6の展開を制限した直後であった。

ベンチマークでは、長期的な技術的タスクを評価するFrontierSWEでOpus 4.8に約1ポイント差で後塵を拝するものの、GPT-5.5を上回った。ツール利用テストのMCP-AtlasではOpusとほぼ同等の結果を残し、Terminal-Bench 2.1では81.0を記録し、Opusの85.0に4ポイント差まで迫った。数学能力を測るAIME 2026テストでは99.2パーセントのスコアを達成している。

Zhipuは6月13日にGLM 5.2をコーディングプラン加入者向けに提供し、3日後には寛容なMITライセンスの下でフルウェイトとベンチマークスコアカードを公開した。企業はモデルをダウンロードし、カスタマイズして自社サーバーでホストすることが可能である。ハーベイ (Harvey) の共同創業者ゲイブ・ペレイラ (Gabe Pereyra) 氏は、CNBCに対しオープンソースがこれほど急速に追いついたことに一貫して驚いていると述べた。

米商務省が外国籍のユーザーをAnthropicの最新モデルから除外したことにより、同社はリアルタイムでの国籍確認が困難なため全世界でモデルを無効化した。その後、OpenAIも政府の要請でGPT-5.6のリリースを段階的に実施した。このような状況下で、ツールが突然利用できなくなるリスクを懸念する企業にとって、政府機関による停止リスクがないオープンモデルは安全な選択肢と見なされるようになった。しかし、米商務省は7月1日、規制を解除し、AnthropicはFable 5とMythos 5の復元を開始し、ブロックされたリクエストはOpus 4.8にルーティングされるようになったと報じられている。この期間は中国のオープンウェイトラボに数週間の勢いを与えた。

独立したテストでは、GLM 5.2が長期間にわたるタスクでOpusモデルに僅差で劣る傾向があること、またスコアがテストに調整されている可能性を指摘する声もある。しかし、多くの企業が商用において「十分な品質」と「低コスト」を重視しており、より安価なオプションへの移行が進む要因となっている。この記事はアリウス・ノレイカ (Alius Noreika) が執筆した。

参考: technology.org (アーカイブ) — 2026年7月2日 17:32 (JST)