OpenAIは2026年6月22日(現地時間)、Cerebrasとの提携を発表した。これにより、同社のプラットフォームに750MWの超低遅延AIコンピューティング能力を追加する。Cerebrasが開発するAIシステムは、大規模な演算能力、メモリ、帯域幅を単一の巨大チップに統合することで、従来のハードウェアでの推論におけるボトルネックを解消し、AIモデルからの長い出力を高速化することを目指す。
CerebrasのAIシステムをOpenAIのコンピューティングソリューション群に統合することで、AIの応答速度を大幅に向上させることを目的としている。AIがリアルタイムで応答することで、ユーザーはより多くの操作を行い、滞在時間を延ばし、より価値の高いワークロードを実行できるとOpenAIは述べている。
OpenAIは、この低遅延のコンピューティング能力を推論スタックに段階的に統合し、様々なワークロードに対応できるよう拡張する計画。容量は2028年までに複数の段階で利用可能になる見込み。
OpenAIのサチン・カッティ (Sachin Katti) 氏は、OpenAIのコンピューティング戦略は、適切なシステムを適切なワークロードに適合させる、回復力のあるポートフォリオを構築することにある。Cerebrasは、当社のプラットフォームに専用の低遅延推論ソリューションを追加すると述べた。Cerebrasの共同創設者兼CEOであるアンドリュー・フェルドマン (Andrew Feldman) 氏は、OpenAIと提携し、世界をリードするAIモデルを世界最速のAIプロセッサに提供できることを喜ばしく思うとコメントしている。
参考: openai.com (アーカイブ) — 2026年6月23日 13:00 (JST)
原文ハイライト"Cerebras adds a dedicated low-latency inference solution to our platform."