レイテント・スペース (Latent Space) は2026年6月30日(現地時間)、Ahmad Osman氏がローカルAIの急速な進展について見解を示したと報じた。同氏はAIエンジニア・ワールドズ・フェア (AI Engineer World’s Fair) でのワークショップを通じ、ローカルAIがノートパソコンからエンタープライズ級のインフラまで広範に進化していると説明。企業がクラウドAIの品質・価格・ポリシー変更リスク、知的財産やプライバシー保護を重視する中、ローカルAIが新たな技術選択肢として台頭しつつある状況を強調した。
Ahmad Osman氏はAIエンジニア・ワールドズ・フェアでのワークショップにて、ローカルAIの実現可能性を示すデモンストレーションを実施しました。参加者は、DGXスパーク (DGX Spark) やAMDストリックス・ハロー (AMD Strix Halo) といったローカルシステムとフロンティアクラウドモデルを比較し、性能、出力品質、速度、遅延を直接体験しました。オスマン氏は、2022年当時のローカルAIに対する認識が依然として残っているものの、状況は大きく改善しており、フロンティアモデルとの性能差が4〜8ヶ月にまで縮まっているとの見方を示しています。自身のGPU保有数についてはThe answer is 22 RTX 3090s.と述べています。
オスマン氏はまた、オープンソースのLLMが大規模なプロプライエタリなフロンティアモデルに対する信頼できる代替手段になりつつあると指摘します。オープンソースモデルとクローズドなフロンティアモデルの性能ギャップは縮小し続けており、ローカルAIシステムの多くがオープンモデルに依存していることから、このシフトがローカルAIを強化すると説明しました。同氏のウェブサイトオープンソースAIマストウィン (Open Source AI Must Win)では、許可なくインテリジェンスシステムを研究、構築、修復、展開、監査、適応、教育、保存、実行する能力は、存在論的に重要であると述べています。
同氏は、ChatGPTやClaude Codeのような製品はモデル単体ではなく、検索、ツール、インフラ、その他のサービスを含む完全なエコシステムを提供していると強調しました。ローカルAIの導入においても、チャットインターフェース、ドキュメント取り込み、エージェント、ハーネス、検索ツールといったエンドツーエンドの層が重要であり、オスマンティック (Osmantic) のオープンソース展開システムがこれを提供しようとしています。ワークショップには、学生からIntelの幹部、エンタープライズエグゼクティブまで多様な参加者が集まり、MacBookや自宅のGPU、専用のハイエンドエンタープライズハードウェアなど、制御可能なシステムの運用に関心を示しました。
オスマン氏は、開発者が必ずしも高価なGPUを購入する必要はなく、モデルの効率性が大幅に向上しているため、現代の電話でも数年前のクラウドシステムを上回るモデルを実行できると説明しました。モデルとハードウェアの双方の進歩が相まって、システムは進化し続けると見られています。クラウドAIの従量課金モデルと比較して、ローカルAIは初期投資はかかるものの、長期的な運用コストの予測可能性とデータガバナンスの確保に優れます。企業は外部プロバイダーのサービス変更リスクを回避し、知的財産や機密データの保護、厳格なプライバシー規制への対応を自社環境で完結できるため、戦略的なインフラ投資の選択肢としてローカルAIへの注目が高まっています。
同氏は、今後ローカルAIとクラウドAIを組み合わせるハイブリッドなアプリケーションが増加すると予測しています。企業はプロバイダーによるモデルの品質、価格設定、アクセス、ポリシーの変更リスクを認識しており、知的財産やデータ、プライバシー、コンプライアンスを制御するために、専用のハードウェアや安全なコンピューティングへの移行が進むという見方を示しています。ラマ (Llama)、Mistral、クエン (Qwen)、ディープシーク (DeepSeek)、GLM、キミ (Kimi) といったオープンソースモデルの各世代がフロンティアシステムとのギャップを縮めている状況も、この流れを後押ししています。
参考: Latent Space (アーカイブ) — 2026年7月1日 08:39 (JST)
原文ハイライト"The answer is 22 RTX 3090s."