NVIDIAは2026年5月27日(現地時間)、知能をリアルタイムで製造する新しいインフラストラクチャとして「AI Factories」を発表した。AI Factoriesは、エネルギーを推論モデルやエージェントが生成する単位であるトークンに変換する「トークン工場」であり、性能はトークンあたりのコストやワットあたりの性能で評価される。

AI Factoriesは、常時稼働し、リアルタイムで知能を製造するために構築されたインフラストラクチャの新種である。産業時代に発電所がエネルギーを電力に変換したように、AI時代ではAI Factoriesがエネルギーを推論モデル、エージェント、インテリジェントシステムの生産単位であるトークンに変換する。その経済性は、1秒あたりのトークン数、1ワットあたりのトークン数、トークンあたりのコスト、稼働率、アップタイムによって定義される。特にワットあたりの性能は、AI Factoriesの競争力を測る究極の尺度となる。

AI Factoriesは、プロンプトへの応答以上の機能を提供する常時稼働の推論という新しいワークロード向けに設計されている。自律エージェントは、推論、計画、検索、ツールの使用、データの取得、コード記述、行動実行を行う。NVIDIA Nemotronを含む高性能なAIモデルがこれらを支える。これらのシステムは、フルスタックで最適化され、モデル、コンピューティング、ネットワーキング、メモリ、ソフトウェア、ストレージ、電力、冷却までを含む。

NVIDIAは、NVIDIA Blackwell Ultra GPUがトークンあたりのコストを低減し、NVIDIA GB300 NVL72システムが前世代と比較して1メガワットあたり50倍以上のトークンを生成し、トークンあたりのコストを35倍低減すると発表している。NVIDIA Dynamo frameworkは、大規模な推論スループットをオーケストレーションする。NVIDIA Vera Rubin platformは、ワットあたりの性能を最大35倍向上させ、トークンコストをさらに削減するよう設計されている。

NVIDIAは、Cisco、Dell、HPE、Lenovo、Supermicroといったグローバルシステムパートナーと緊密に連携し、エンタープライズデータセンターにAIインフラストラクチャを提供している。また、自社でもAI Factoryを運用し、数百の自律AIエージェントがエンジニアリング、ソフトウェア、運用チームを支援している。金融サービスから製造業、公共部門に至るまで、あらゆる業界の組織がAI Factoryを構築またはレンタルする必要があると見込まれる。


参考: NVIDIA Blog (AI) — 2026年5月28日 01:00 (JST)

この記事をシェア
X はてブ LinkedIn