AIチップメーカーのCerebras Systemsは2026年5月11日(現地時間)、新規株式公開 (IPO) における発行株数と価格を引き上げる見込みだと報じられた。AI向け半導体需要が急増するなか、同社株への強い需要が背景にある。AIの演算処理はこれまでグラフィックス処理ユニット (GPU) が中心だったが、将来的には訓練から推論まで、より多様なハードウェア構成が求められるとの見方が示されている。

複数の関係者によると、Cerebras SystemsはIPOにおいて、1株あたりの価格を150~160ドルに引き上げ、発行株数も2800万株から3000万株に増やすことを検討している。この動きは、AI、特にエージェント (agent) が大量の演算能力を必要とすることで、半導体関連株の需要が押し上げられているためと見られている。

これまで、グラフィックス処理ユニット (GPU) は、その並列処理の特性とNvidiaによるCUDAエコシステムを通じて、AIの訓練における中心的な存在であった。Nvidiaは、高帯域幅メモリ (HBM) とチップ間ネットワーキングへの投資により、この分野で主導的な地位を確立している。AIワークロードにおいては、訓練だけでなく推論 (inference) も主要な要素であり、プリフィル、KVキャッシュの読み取り、モデルウェイトへのフィードフォワード計算の3つの主要部分から構成される。GPUはこれらすべての処理に対応しており、AnthropicがSpaceXと契約を結び、Colossus 1データセンターにある22万基以上のNvidia製GPUを含むコンピューティング能力を利用する事例がその活用範囲を示している。

一方、Cerebrasは異なるアプローチを採用している。同社のWSE-3チップは、ウェハー全体を単一のチップとして機能させることで、従来のレティクルリミットを超越する設計だ。WSE-3は44GBのオンチップSRAMを21 PB/sの帯域幅で提供する。これは、Nvidia H100の80GB HBMと3.35 TB/sと比較すると、メモリ容量は半分程度ながら、帯域幅は約6000倍に達する。このWSE-3は、H100が最も使用される推論タスクに特に適しているとCerebrasは説明する。Cerebrasは、高速な推論がコーディングにおける思考速度向上に寄与すると指摘している。ただし、モデルやKVキャッシュのサイズがオンチップメモリを超過する場合、Cerebrasの速度メリットが薄れる可能性がある。


参考: Stratechery (アーカイブ) — 2026年5月11日 19:00 (JST)

原文ハイライト

"We’ve signed an agreement with SpaceX to use all of the compute capacity"

この記事をシェア
X はてブ LinkedIn