AIチップスタートアップのGroq(グロック)は2026年5月30日(現地時間)、Axiosが報じたところによると、新たな資金調達ラウンドで6億5000万ドルを調達した。同社は、従来のハードウェア販売から、推論に特化したLPU(Language Processing Unit)を基盤とする「Inference-as-a-Service」モデルへの戦略転換を進めており、市場に存在する高遅延・高コストなAI推論サービスへの対抗を目指す。この大規模な資金は、「GroqCloud」プラットフォームの規模拡大とサービス提供能力の強化に充てられる見込みだ。
過去2年間、AI業界では大規模言語モデル(LLM)の訓練(training)に焦点が当てられ、OpenAI、Meta、Googleといった企業はNvidia H100 GPUに数十億ドルを投じてきた。しかし、これらのモデルが実運用段階に移行するにつれて、訓練済みのモデルを実行して応答を生成する推論(inference)への関心が高まっている。
Groqが開発したLPUは、言語の連続的な性質に合わせて設計されており、従来のGPUを大幅に上回る速度を提供する。例えば、Llama 3のようなモデルにおいて、毎秒数百トークンを配信できる。NvidiaのGPUが汎用的な並列プロセッサであり、高帯域幅メモリ(HBM)を使用することで遅延が発生するのに対し、GroqのLPUはSoftware-Defined Hardwareアプローチを採用している。これは、HBMよりも高速なSRAM(Static Random Access Memory)を利用し、コンパイラが命令の実行タイミングを正確に把握できる確定的(deterministic)な設計により、オーバーヘッドと遅延を削減する。開発者が異なるバックエンドをテストする際、Time to First Token(TTFT)においてLPUベースのサービスと標準的なGPUサービスでは顕著な差が確認されている。
今回の6億5000万ドルの資金調達は、Groqが買収対象ではなく、独立した存在として事業を拡大する姿勢を示している。この大規模な資金注入により、Groqは「GroqCloud」プラットフォームを拡大し、MixtralやLlama 3といった主要モデルへの対応能力を高める。開発者にとって、この資金は市場シェア獲得のための初期段階での利用料補助につながり、低コストでのサービス利用が可能になる。また、この資金はハードウェアのスケーリングとデータセンターの維持を確実にすることでサービスの信頼性向上に寄与し、さらにDeepSeekやQwenなどの新しいモデルのLPUアーキテクチャへの移植加速にも活用される。
参考: explore.n1n.ai (アーカイブ) — 2026年5月30日 11:56 (JST)
原文ハイライト"Groq is in the process of raising $650 million in a new funding round."