【速報】Vercel AI Gateway、NvidiaのNemotron 3 Ultraを提供開始

Vercelは2026年6月4日(現地時間)、NvidiaのNemotron 3 UltraモデルがVercel AI Gatewayで利用可能になったと発表した。Nemotron 3 Ultraは、長時間の複数ステップにわたるエージェントワークフローのオーケストレーション向けに構築された、オープンなMixture-of-Experts推論モデルである。1Mトークンのコンテキストウィンドウを持ち、計画、ツール利用、サブエージェント委譲、エラー回復といったマルチターンエージェントワークフローに対応する。

Nemotron 3 Ultraは、スループットが最大350トークン/秒に達し、エージェントタスクにおけるコストを最大30%削減する。AI Gatewayを通じてこのモデルを利用するには、AI SDKでモデル名をnvidia/nemotron-3-ultra-550b-a55bに設定する。

AI Gatewayは、モデルの呼び出し、利用状況とコストの追跡、リトライ、フェイルオーバー、そしてプロバイダーよりも高い稼働率を実現するためのパフォーマンス最適化を可能にする統合APIを提供する。また、カスタムレポート、Zero Data Retentionサポート、遅延とコストによる動的なプロバイダーソートなどの機能を内蔵している。

AI Gatewayは、プロバイダーの価格をそのまま反映し、マークアップは適用しない。また、Bring Your Own Key (BYOK) リクエストを含む推論に対してプラットフォーム手数料を課金しない。ユーザーはAI Gatewayのモデルリーダーボードで詳細を確認するか、モデルプレイグラウンドで試すことができる。

参考: Vercel Blog (アーカイブ) — 2026年6月4日 16:00 (JST)