Vercel(バーセル)は6月8日(現地時間)、ブログでAI Gatewayの月次プロダクションインデックスを公開した。これによると、5月のAI利用において、DeepSeek(ディープシーク)のトークンシェアが単月で1%未満から17%へ急増し、OpenAI(オープンエーアイ)を上回って第3位となった。しかし、総支出におけるDeepSeekのシェアは約1%に留まっている。一方で、Anthropic(アンスロピック)は総支出シェアを61%から65%に拡大し、高リスクなユースケースでは70%から80%の支出シェアを維持した。

AI Gatewayは毎月、プロダクションアプリケーションとAIラボ間で数十兆のトークンをルーティングし、実際のAI利用状況を可視化している。

5月、AI Gatewayの総トークン量は前月比20%増、総支出は同43%増を記録した。顧客は平均で4月よりも約20%多くトークンあたり費用を支払っている。

2月から4月にかけてAI Gateway上のラボ間ボリューム分布は緩やかに変化していたが、5月にはDeepSeek V4のローンチがトークンシェアを大きく変えた。DeepSeekは4月にAI Gatewayのトークン量の1%未満、支出の0.2%未満を占めるに過ぎなかったが、5月にはトークンシェアが17%に急増し、OpenAIを抜き第3位になった。このボリュームのほぼ全ては、deepseek/deepseek-v4-flashとdeepseek/deepseek-v4-proの2モデルによる。

Vercel Blogの分析では、価格競争力に加え、DeepSeek V4を評価したチームが既存の評価基準に対し十分な品質と判断し、本番環境への導入に至ったと指摘されている。DeepSeekのトークンシェアが急増した一方で、支出シェアは約1%に留まった。DeepSeek V4 Flashは100万トークンあたり入力0.14ドル、出力0.28ドルでリリースされ、同等のAnthropicモデルより20〜50倍、Qwen(キューウェン)3.6 PlusやKimi(キミ)K2.6のようなバリューティアのモデルよりも8〜12倍低価格だった。

低価格市場のボリュームが最も速く成長したにもかかわらず、高価格帯の支出はドルベースでより速く成長した。Anthropicのトークンシェアは26%から32%に、支出シェアは61%から65%に増加した。OpenAIのトークンシェアは約13%で維持されたが、支出シェアは12%から13%へと増加した。平均トークンコストは5月に上昇し、これはフロンティアモデルを要求する作業がそれ以外の作業よりも速く成長したためとみられる。

AIコーディングエージェントのユースケースでは、DeepSeekがトークンボリュームの49%を占めたが、コストの4%に過ぎなかった。Anthropicはトークンの28%、コストの70%を占めている。低コストモデルがプロダクションワークフローの重要な部分を占めるようになった一方で、フロンティアモデルの利用も引き続き増加しており、これが全体の支出増を牽引しているとみられる。

コスト規律がルーティング戦略として採用された。チームは低価格で大量の作業を低価格モデルに送り、品質が最も重要な場所でフロンティアモデルを使用した。Google(グーグル)のGemini(ジェミニ)3.5 Flashの採用が遅いことがその一例である。Gemini 3.5 Flashは5月にGemini 3 Flashより高い価格でリリースされたが、大規模な移行は発生しなかった。月末までに、3.5はFlashファミリーのトークンのわずか7%を占めるに過ぎず、3.0が支配的だった。


参考: Vercel Blog — 2026年6月8日 13:00 (JST)

原文ハイライト

"Price alone wouldn’t have shifted DeepSeek’s volume that much in a month"

この記事をシェア
X はてブ LinkedIn