【速報】JetBrains、12B Mixture-of-Expertsモデル「Mellum2」を発表
JetBrainsは2026年5月31日(現地時間)、自然言語とコードでゼロから学習した12BパラメータのMixture-of-Experts (MoE) モデル「Mellum2」を発表した。このモデルは、トークンごとに2.5Bのパラメータのみをアクティブにするため、高スループットかつ低レイテンシーの推論に効率的である。Apache 2.0ライセンスのもとで公開された。
Tag
3 件の関連記事
JetBrainsは2026年5月31日(現地時間)、自然言語とコードでゼロから学習した12BパラメータのMixture-of-Experts (MoE) モデル「Mellum2」を発表した。このモデルは、トークンごとに2.5Bのパラメータのみをアクティブにするため、高スループットかつ低レイテンシーの推論に効率的である。Apache 2.0ライセンスのもとで公開された。
Cohereは2026年5月20日(現地時間)、企業向けに設計された大規模言語モデル「Command A+」をApache 2.0ライセンスのもと、オープンソースとして公開した。このmixture-of-experts (MoE) アーキテクチャを採用したモデルは、複雑な推論、マルチモーダル処理、多言語エージェントタスクに対応する。開発者がエンタープライズグレードのエージェント機能を直接利用できるよう、Hugging Faceを通じてモデルの重みが提供され、専用のマネージド推論環境であるModel Vaultでのデプロイも可能。前世代モデルを上回る性能向上と効率性を両立している。
IBMは2026年5月4日(現地時間)、オープンソースライセンスの多言語埋め込みモデル「Granite Embedding Multilingual R2」を発表した。このリリースには、ModernBERTを基盤とする2つのモデルが含まれる。97Mパラメータのコンパクトモデルは、MTEB Multilingual Retrievalにおいてオープンな100Mパラメータ未満の全埋め込みモデル中で最高スコアを記録した。また、311Mパラメータのフルサイズモデルも公開され、両モデルともに200以上の言語をサポートし、52言語で強化された検索品質、32Kトークンのコンテキスト長、Apache 2.0ライセンスでの提供が特徴である。