Vercelは2026年6月4日(現地時間)、NvidiaのNemotron 3 UltraモデルがVercel AI Gatewayで利用可能になったと発表した。Nemotron 3 Ultraは、長時間の複数ステップにわたるエージェントワークフローのオーケストレーション向けに構築された、オープンなMixture-of-Experts推論モデルである。1Mトークンのコンテキストウィンドウを持ち、計画、ツール利用、サブエージェント委譲、エラー回復といったマルチターンエージェントワークフローに対応する。
Nemotron 3 Ultraは、スループットが最大350トークン/秒に達し、エージェントタスクにおけるコストを最大30%削減する。AI Gatewayを通じてこのモデルを利用するには、AI SDKでモデル名をnvidia/nemotron-3-ultra-550b-a55bに設定する。
AI Gatewayは、モデルの呼び出し、利用状況とコストの追跡、リトライ、フェイルオーバー、そしてプロバイダーよりも高い稼働率を実現するためのパフォーマンス最適化を可能にする統合APIを提供する。また、カスタムレポート、Zero Data Retentionサポート、遅延とコストによる動的なプロバイダーソートなどの機能を内蔵している。
AI Gatewayは、プロバイダーの価格をそのまま反映し、マークアップは適用しない。また、Bring Your Own Key (BYOK) リクエストを含む推論に対してプラットフォーム手数料を課金しない。ユーザーはAI Gatewayのモデルリーダーボードで詳細を確認するか、モデルプレイグラウンドで試すことができる。
参考: Vercel Blog (アーカイブ) — 2026年6月4日 16:00 (JST)
原文ハイライト"Nemotron 3 Ultra from Nvidia is now available on Vercel AI Gateway"