【速報】Together AI、MiniMax M3の推論効率化技術とホスティングを発表
Together AIは2026年6月1日(現地時間)、MiniMaxの最新モデルM3について、同社がプリファードクラウドパートナーとして効率的な推論を実現したと発表した。同社の推論およびカーネルチームは、KV-Block-Major sparse attention kernelなどの主要な最適化により、異なる同時実行レベルで81%から125%のスループット向上を達成した。MiniMax M3はオープンウェイトモデルとして公開後、Together AIが開発者向けエンドポイントとしてホストする。