Vercelは2026年6月23日(現地時間)、AI Gatewayにおいて「GLM 5.2 Fast via Wafer」の提供を開始したと発表した。同社はベンチマークテストの結果、WaferがサーバーレスでGLM-5.2を提供する他のプロバイダーと比較して最大2倍のスループットを達成したとしている。

Vercelは、AI GatewayでGLM 5.2 Fast via Waferの提供を開始した。同社によるスモールコンテキスト、ラージコンテキスト、ツールコールシナリオでのベンチマークテストの結果、WaferはサーバーレスでGLM-5.2を提供する他のプロバイダーと比較して2倍高いスループットを実現した。特にデコード速度と、スモールコンテキストおよびラージコンテキストでの持続的な生成におけるエンドツーエンドの速度で優位性を示している。テストでは、GLM 5.2 Fast on Waferはスモールコンテキストで170+ tok/s、ラージコンテキストで200+ tok/sを記録した。

GLM 5.2 Fastを利用するには、AI SDKでモデルをzai/glm-5.2-fastに設定する。AI Gatewayは、モデル呼び出しのための統合APIを提供し、使用状況とコストの追跡、リトライ、フェイルオーバー、およびプロバイダーよりも高い稼働率のためのパフォーマンス最適化を可能にする。これには、組み込みのカスタムレポート、Zero Data Retention support、APIキーの予算設定などが含まれる。

AI Gatewayは、プロバイダーの価格設定を反映し、マークアップは行わない。また、Bring Your Own Key (BYOK) リクエストを含め、推論に対するプラットフォーム手数料は請求しない。GLM 5.2 Fastはモデルプレイグラウンドで試すことができる。


参考: Vercel Blog (アーカイブ) — 2026年6月24日 09:00 (JST)

原文ハイライト

"Wafer delivers a 2x higher throughput than other providers serving GLM-5.2 on serverless"

この記事をシェア
X はてブ LinkedIn