Z.AIは2026年6月17日(現地時間)、長尺タスク向けフラッグシップモデル「GLM-5.2」を公開した。MITオープンソースライセンスの下で提供される本モデルは、前バージョン「GLM-5.1」から長尺タスク処理能力を大幅に向上させ、安定した1Mトークンのコンテキストを初めて実現。高度なコーディング機能と改良されたアーキテクチャを特徴とし、複雑なタスクへの対応力を高めた。

GLM-5.2は、安定した1Mコンテキスト、柔軟な思考レベルを備えた高度なコーディング機能、改良されたアーキテクチャ、そしてMITオープンソースライセンスを主要な特徴としている。特にアーキテクチャ面では、IndexShareを導入したことで、1Mコンテキスト長においてパー・トークンFLOPsを2.9倍削減した。さらに、推測的デコーディング向けのMTPレイヤーも改善され、アクセプタンス長を最大20%向上させている。

モデルの性能は複数の長尺コーディングベンチマークで示されている。FrontierSWEではOpus 4.8に1%差で続き、GPT-5.5を1%、Opus 4.7を11%上回る結果を出した。PostTrainBenchではOpus 4.8に次ぐ2位を記録し、Opus 4.7とGPT-5.5を凌駕する性能を見せた。SWE-MarathonではOpus 4.8には13%の差があるものの、Opusシリーズに次ぐ2位を維持した。これら3つの主要な長尺ベンチマーク全てにおいて、GLM-5.2はオープンソースモデルの中で最高位を達成している。

標準コーディングベンチマークにおいても、GLM-5.1から大幅な改善を見せている。Terminal-Bench 2.1では81.0(GLM-5.1は63.5)、SWE-bench Proでは62.1(GLM-5.1は58.4)を記録した。クローズドソースモデルとの差も縮め、Terminal-Bench 2.1ではClaude Opus 4.8(85.0)に数ポイント差まで迫り、Gemini 3.1 Proを上回る性能を持つ。GLM-5.2はまた、努力レベル制御機能を導入しており、ユーザーはモデルの能力とタスク実行速度および計算コストのバランスを調整することが可能だ。

MITオープンソースライセンスでの提供と1Mトークンコンテキストの安定化は、生成AIの導入を検討する企業や開発者にとって重要な意味を持つ。商用利用の障壁が低く、コミュニティによる改善が期待できるオープンソースモデルは、AIソリューションの開発コストを抑制し、特定の要件に合わせたカスタマイズを容易にする。特に大規模なコンテキスト処理能力は、複雑なビジネスロジックを含むコードベースの解析、長文ドキュメントからの情報抽出、あるいは大規模システムの設計支援など、従来のモデルでは困難だった高度な長尺タスクへの応用を可能にする。これにより、特定の垂直市場におけるLLMの適用範囲を広げ、AIエコシステム全体の競争力向上に寄与すると見られる。


参考: Hugging Face Blog (アーカイブ) — 2026年6月17日 09:31 (JST)

原文ハイライト

"Built for Long-Horizon Tasks"

この記事をシェア
X はてブ LinkedIn