2026年5月13日(現地時間) NVIDIAは、自己改善型AIエージェント「Hermes Agent」がNVIDIA RTX PCおよびNVIDIA DGX Spark上で高性能を発揮すると発表した。Nous Researchが開発したHermesは、信頼性と自己改善に特化して設計されている。公開から3ヶ月足らずでGitHubのスターは14万以上となり、OpenRouterによると先週時点で世界で最も利用されているエージェントである。AlibabaのQwen 3.6シリーズは、Hermesのようなローカルエージェントの実行に最適とされる。

Hermesはプロバイダーやモデルに依存しない設計で、常に稼働するローカル利用に最適化されている。NVIDIA RTX PC、NVIDIA RTX PROワークステーション、NVIDIA DGX Sparkは、これをフルスピードで連続稼働させる理想的なハードウェアである。AlibabaのQwen 3.6 27Bおよび35Bパラメーターモデルは、以前の120Bおよび400Bパラメーターモデルを凌駕し、NVIDIA RTXおよびDGX Spark上でエージェントAIを加速させる。

Hermesの主要な機能として、自己進化スキル、コンテナ化されたサブエージェント、設計による信頼性、そして同一モデルを用いた開発者による比較で一貫して優れた結果を示す点が挙げられる。Hermesは、複雑なタスクに遭遇したりフィードバックを受けたりするたびに、学習内容をスキルとして保存し、時間の経過とともに適応し改善する。サブエージェントは短命で隔離されたワーカーとして扱われ、タスクの整理を維持し、エージェントの混乱を最小限に抑える。Nous ResearchはHermesに同梱される全てのスキル、ツール、プラグインを厳選し、ストレステストを実施している。Hermesは、タスクごとの実行ではなく、持続的なオンデバイスエージェントを可能にするアクティブなオーケストレーションレイヤーとして機能する。

最新のQwen 3.6モデルは、Qwen 3.5シリーズを基盤とし、ローカルAIエージェントのさらなる進化を実現する。新しいQwen 3.6 35Bモデルは、約20GBのメモリで動作しながら、70GB以上のメモリを必要とする120Bパラメーターモデルを凌駕する。また、Qwen 3.6 27Bは、Qwen 3.5 397Bのような400Bパラメーターモデルと同等の精度を実現しつつ、サイズは16分の1である。NVIDIA Tensor CoresはAI推論を加速し、スループットの向上とレイテンシの低減を提供する。

Hermesのようなエージェントは継続的に稼働するよう設計されており、NVIDIA DGX Sparkは、このような持続的な終日エージェントワークフローのために構築された、コンパクトで効率的なスタンドアロンマシンである。128GBの統合メモリと1ペタフロップのAI性能を備え、NVIDIA DGX Sparkは120Bパラメーターの混合エキスパートモデルを終日実行できる。HermesをNVIDIAハードウェアでローカルに実行する際は、Hermes GitHubリポジトリからllama.cpp、LM Studio、またはOllamaと組み合わせて使用することが可能である。Hermes AgentはLM StudioおよびOllamaのサポートを標準で提供する。

RTX AI Garageからは、NVIDIA RTX PRO GPUがllama.cppでQwen 3.6モデルを実行する際にトークン生成を最大3倍高速化すること、GoogleのGemma 26Bおよび31BモデルがNVIDIA Blackwell GPU向けのNVFP4チェックポイントとして利用可能であること、Mistral Medium version 3.5がllama.cppおよびOllamaとの互換性アップデートを含むこと、NVIDIA NemoClawがNVIDIAデバイスでのOpenClawエクスペリエンスを最適化するオープンソーススタックとして導入され、Windows Subsystem for Linux (WSL2)をサポートすることなどが報じられている。


参考: NVIDIA Blog (AI) — 2026年5月13日 22:00 (JST)

この記事をシェア
X はてブ LinkedIn