NVIDIA、Vision AIエージェント向け新ワークフローを発表

NVIDIAは6月30日(現地時間)、合成データ生成とモデル微調整を通じてVision AIエージェントの精度を向上させる新たなワークフローを公開しました。NVIDIA OmniverseおよびNVIDIA Metropolisを基盤とするこの開発手法は、工場やスマートシティなど多様な環境でのAIエージェントの展開と最適化を加速させ、開発サイクルの課題解決に寄与します。

市場調査会社Gartnerは、2028年までにエンタープライズが管理するデータの3分の2以上がデータセンターまたはクラウド外で作成および処理され、2029年までに世界中のすべてのエンタープライズの3分の2以上がエッジAIを展開すると予測しています。しかし、Gartnerのレポートは、既存のエッジデータの最大90%が未処理のままだと指摘しています。

NVIDIAは、Vision AIエージェント開発における主要な課題として、データのギャップによる精度停滞、微調整に関する専門知識の不足、複雑で時間のかかるエージェント組み立てワークフローの3点を挙げています。これらの課題に対処するため、NVIDIAはOpenUSD（Universal Scene Description）を基盤とするNVIDIA Omniverseを活用したシミュレーションと合成データ生成、さらにNVIDIA Metropolisによるモデル開発とビデオAI展開を組み合わせた統合ソリューションを提供します。NVIDIA agent skillsおよびblueprintsは、データ生成、モデル改善、Vision AIエージェントの迅速な展開を可能にする再利用可能なワークフローです。

具体的な導入事例として、製造業分野では、ロボフロー (Roboflow) がNVIDIA Defect Image Generation skillを統合し、コーニング (Corning) のような顧客向けに合成欠陥画像を生成しています。これにより、訓練データが少ない状況でも平均精度95%、最も困難な欠陥クラスで完全な再現率を達成し、複数四半期にわたる検査プロジェクトを数日に短縮しました。スマートシティ分野では、リンカー・ビジョン (Linker Vision) がNVIDIA Metropolis Blueprint for VSS（ビデオ検索および要約）を使用し、高雄での開発工数を85%削減し、インシデント対応時間を最大80%短縮しています。産業オペレーションでは、ディープハウ (DeepHow) のLive Standard Operating Procedure (SOP) Verificationエージェントがフォックスコン (Foxconn) のNVIDIA GB300 server production linesでNVIDIA Metropolis VSS blueprintを採用。初回合格率を3%向上させ、重要なSOPステップのマイクロアクション理解において99%のタスクレベル精度を達成しました。

参考: NVIDIA Blog (AI) (アーカイブ) — 2026年6月30日 22:00 (JST)