ジーブ・エーアイ (Zhipu AI) は2026年6月29日(現地時間)、最新の旗艦モデル GLM-5.2 を発表した。同社は、このモデルがサイバーセキュリティおよびソフトウェア脆弱性発見の専門ベンチマークにおいて、Anthropic の Mythos と同等の性能を達成したと主張している。この発表は、グローバルなAI開発競争における中国企業の技術的進展を示すものとして注目される。
北京 (Beijing) を拠点とするジーブ・エーアイは、GLM-5.2 が厳格なテストを必要とするエンタープライズグレードのセキュリティソリューション分野における信頼できるプレイヤーとして位置づけられると説明した。同社が共有した内部文書によると、GLM-5.2 は自動侵入テスト環境や静的解析スイートを含む業界標準ベンチマークでテストされた。
公開された性能比較では、GLM-5.2 の脆弱性検出率は94.2%、Anthropic Mythos は93.8%とされた。偽陽性率は GLM-5.2 が3.1%、Mythos が2.9%で、いずれも低い水準である。コンテキストウィンドウのサポートは両モデルともに200万トークンを維持している。このデータは、サイバーセキュリティの文脈において両モデル間の性能差がほぼ消失したことを示唆している。
高度なAIのサイバーセキュリティワークフローへの統合は、防御体制のパラダイムを変えるとされる。バグ発見が人間に依存してきたこれまでのプロセスから、AIが24時間体制のシステムアーキテクチャ監査役を務める「アシスト型セキュリティ」への移行が進む。ジーブ・エーアイは、GLM-5.2 モデルには悪意あるエクスプロイトコードの生成を防ぐための強固なガードレールが組み込まれていると述べている。同社は、西側先進モデルとの差が縮まりつつある状況をシリコン・カーテン (Silicon Curtain)が多孔質になりつつあると表現した。
原文ハイライト"achieves parity with Anthropic’s highly acclaimed Mythos on specialized cybersecurity and software vulnerability-finding benchmarks."