NVIDIAは2026年6月23日(現地時間)、Amazon Web ServicesAWS との協業により、AIシステムの大規模な本番環境展開を強化すると発表した。Amazon OpenSearchおよびAmazon EC2におけるNVIDIAのAIインフラストラクチャ活用を通じ、低遅延推論、高速ベクトル検索、GPUの価格性能比向上、運用の複雑性低減に取り組む。
新たな取り組みとして、Amazon EC2 G7インスタンスはNVIDIA RTX PRO 4500 Blackwell Server Edition GPUsを搭載し、AI推論、グラフィックス、空間コンピューティング、GPUアクセラレーションによるデータ分析ワークロードに対応する。G7インスタンスはG6インスタンスと比較して、AI推論性能が最大4.6倍、グラフィックス性能が最大2.1倍向上する。
また、Amazon OpenSearch Serverlessでは、NVIDIA cuVSライブラリを活用し、GPUアクセラレーションによるベクトルインデックスがすべてのベクトルコレクションでデフォルトの演算選択となる。これにより、CPUのみの構築と比較して、ベクトルインデックスの速度が最大10倍に向上し、コストは4分の1に削減される。10億規模のベクトルデータベースを1時間未満で構築することが可能になる。
さらに、AWSはNVIDIA GB300を用いたトレーニングワークロードにおいて、NVIDIA Exemplar Cloudステータスを達成した。これは、AWSがNVIDIAが設定する厳格なパフォーマンス基準を満たしたことを示すもので、大規模なトレーニング向けクラウドインフラストラクチャの信頼性向上に寄与する。
参考: NVIDIA Blog (AI) (アーカイブ) — 2026年6月24日 09:05 (JST)
原文ハイライト"vector indexing up to 10x faster at a quarter of the cost"