NVIDIAは2026年5月31日(現地時間)、ComputexにおけるJensen Huang氏の基調講演で、同社史上最大のNemotron 3モデル「Nemotron 3 Ultra」を発表した。5500億の総パラメータ(550億アクティブ)を持ち、米国製オープンウェイトモデルの中で最高の知能指数と高速な推論性能を実現した。
Nemotron 3 Ultraは、Artificial Analysis Intelligence Indexで48点を記録し、米国製オープンウェイトモデルの知能において新たなリーダーとなった。これは、Gemma 4 31B(39点)、Nemotron 3 Super(36点)、gpt-oss-120b(33点)といったモデルを上回る。ただし、中国主導のオープンウェイトモデルであるKimi K2.6(54点)には及ばない。
推論速度に関して、Nemotron 3 UltraはプレリリースのDeepInfraエンドポイントで300トークン/秒以上の性能を示した。これは、DeepSeekやMoonshot(Kimi)といった中国拠点のラボによる同規模のモデルが現在市場で提供している50〜100トークン/秒の速度を大きく上回る。gpt-oss-120bは同様の速度で提供されているが、知能は著しく低い。
NVIDIAは、Nemotron 3 UltraのBF16ウェイトの提供に加え、Nemotron 3 Superと同様にNVFP4量子化でもモデルを提供し、さらに高い推論性能を目指す。追加の分析と詳細なベンチマークは公開時に共有される予定。
参考: artificialanalysis.ai — 2026年6月1日 14:30 (JST)
この記事をシェア