【速報】NVIDIA、初のAgentic AIベンチマークでBlackwell Ultra NVL72が性能を主導

NVIDIAは2026年6月12日(現地時間)、アーティフィシャル・アナリシス (Artificial Analysis) が実施した業界初のAgentic AIベンチマーク「AgentPerf」の公開結果で、NVIDIA Blackwell Ultra NVL72プラットフォームが優れた性能を発揮したと発表した。特に、Agentic AIワークロードにおいてNVIDIA Hopperシステムと比較してメガワットあたり20倍多くのエージェントを実行した。

Agentic AIは、従来の会話型AIとは異なるワークロードである。エージェントは目標を複数のステップに分解し、タスク完了まで継続する。これには、コンテキスト収集、観察、推論、行動のために複数のLLM呼び出しとツール呼び出しを連鎖させ、数十から数百のLLM呼び出しを必要とする。既存のAI推論ベンチマークは単一のLLM呼び出しを測定するものであり、Agenticワークロードの複雑さには対応していなかった。

AgentPerfは、DeepSeek V4 Proのような大規模な混合エキスパート (MoE) モデルを使用してAgentic性能を測定した。NVIDIA GB300 NVL72は、NVIDIA HGX H200システムよりもメガワットあたり最大20倍多くのエージェントを実行し、最高の性能を示した。この性能優位性は、72基のGPUを単一のラックスケールシステムに接続し、モデル実行を効率的に分散するGB300 NVL72のアーキテクチャに由来する。CUDAカーネルは通信と計算を重複させることで効率を高め、TensorRT LLMは同時Agentセッションのスケーリングを維持する。

AgentPerfは、実際のコーディングエージェントの軌跡に基づいている。エージェントがタスクを受け取り、ファイルを読み書きし、コードを実行し、結果に基づいて反復するプロセスを測定する。Baseten、DeepInfra、Together AIといった推論プロバイダーは、既にNVIDIA Blackwell上でDeepSeek V4 Proなどのモデルを利用し、Agenticアプリケーションを提供している。Together AIはCursorに、DeepInfraはPam.aiにそれぞれNVIDIA Blackwellを利用している。NVIDIA Vera Rubinアーキテクチャは現在本格的に生産されており、Agentic AIの需要に対応する次世代のインフラ容量を提供している。

参考: NVIDIA Blog (AI) (アーカイブ) — 2026年6月13日 06:00 (JST)