NVIDIA、Cosmos 3とNemotron 3 Ultraを発表、RTX Sparkもプレビュー

NVIDIAは2026年6月1日(現地時間)、AIモデル「NVIDIA Cosmos 3」および「Nemotron 3 Ultra」の発表に加え、パーソナルコンピュータ向けのスーパーチップ「RTX Spark」をプレビューした。Cosmos 3は言語、画像、動画、音声、アクションを統合するオープンウェイトモデルであり、Nemotron 3 Ultraは550B-A55BのオープンウェイトLLMとして提供される。

NVIDIA Cosmos 3は、言語、画像、動画、音声、アクションをMixture-of-Transformersアーキテクチャで統合する。これは、オートレグレッシブ推論器と拡散型生成器を組み合わせたもので、base Nano (16B) とSuper (64B) のモデルサイズで提供される。Text2ImageおよびImage2Video向けにファインチューニングされたSuperモデルは、オープンウェイトの画像生成および動画生成モデルにおいて新たなSOTA（現状最高性能）を達成したとされる。NVIDIAは、ウェイト、コード、データセット、ファインチューニングレシピを含むフルスタックリリースとしてCosmos 3を位置づけ、Runwayを含むパートナーと共にCosmos Coalitionを立ち上げ、世界モデル向けのオープンエコシステムの構築を目指している。

「Computex」において発表されたNemotron 3 Ultraは、550B-A55Bのパラメータを持つオープンウェイトLLMであり、その効率性と速度が評価され、米国のSOTAモデルとされている。コミュニティからの反応は強く、一部のオープン評価で上位にランクインし、特定のセットアップでは300+トークン/秒で提供されるとの報告もある。

RTX Sparkは、パーソナルコンピュータ向けの1ペタフロップススーパーチップとしてプレビューされた。MicrosoftとOpenClaw、Hermes Agentがローンチパートナーとして参加する。NVIDIAのJacob Freemanは、このSuperchipが新しいクラスの薄型ノートPCに統合される仕組みについて言及した。

これらNVIDIAの発表に加えて、MiniMaxは1Mコンテキストとネイティブなマルチモダリティを持つオープンウェイトのマルチモーダルエージェント/コーディングモデル「M3」を発表した。M3はSWE-Bench Proで59.0%、Terminal Bench 2.1で66.0%、MCP Atlasで74.2%のベンチマーク結果を示した。Novita、Vercel AI Gateway、Cloudflare AI Gatewayを含む複数のインフラベンダーが即日サポートを提供した。また、AlibabaはGUIとCLI操作、ビジュアル推論、コーディング、検索拡張QAを統合したマルチモーダルインタラクティブハイブリッドエージェント「Qwen3.7-Plus」を公開した。JetBrainsは、ルーティング、RAG、サブエージェント、IDE利用向けの超低遅延推論を目的とした12B MoEモデル「Mellum2」をリリースし、vLLMに即座に統合された。

現在の動向として、モデル呼び出しからエージェントランタイムへと技術スタックが移行している点が挙げられる。Perplexityは「Search as Code」を導入し、モデルが検索SDKに対してPythonコードを記述することで、カスタムランキングやバッチ処理などを可能にした。GoogleはGemini APIでマネージドエージェントの詳細を公開し、LangChainはDeep Agents、Context Hub、LangSmith Sandboxes/Engineに関する同様の構想を推進している。一方、大規模なコンテキストウィンドウがあってもクロスセッションメモリの問題は依然として未解決の課題であり、企業エージェントにおいてはセキュリティが導入の障壁となっているとMicrosoft Security Intelligenceが警告した。

参考: Latent Space — 2026年6月2日 12:28 (JST)