Cohereは2026年6月9日(現地時間)、開発者向けモデル「North Mini Code」をHugging Face上で公開した。これは同社初のモデルファミリーとなる300億パラメータのMixture-of-Expertsモデルで、30億のアクティブパラメータを持ち、エージェント型ソフトウェアエンジニアリングタスクに特化して設計・訓練された。Apache 2.0ライセンスで利用可能。

North Mini Codeは、複雑なソフトウェアエンジニアリングワークフロー、ターミナルベースのエージェントタスク、および高品質なコード生成に最適化されている。Artificial AnalysisのCoding Indexでは33.4点を記録し、Qwen3.5 (35B-A3B) やGemma 4 (26B-A4B) などの既存のオープンソースモデル、さらにNemotron 3 Super (120B-A12B) やMistral Small 4 (119B-A6B) といった大規模モデルをも上回る性能を示した。同サイズクラスのオープンソースコーディングモデルの中で最も強力なモデルの一つと評価されている。

North Mini Codeは、デコーダーのみのTransformerベースのスパースなMixture-of-Expertsモデルである。訓練は、二段階のカスケーディング教師ありファインチューニング (SFT) と、エージェント型コーディングに特化した検証可能な報酬による強化学習 (RLVR) を経て行われた。SFTの第一段階ではプログラミング、推論、指示追従にわたる広範なデータミックスを統合し、第二段階ではエージェント型および推論駆動のサンプルに特化したデータミックスが使用された。合計7万以上の検証可能なタスクと約5千のユニークなリポジトリから成るデータセットが用いられている。

このモデルは、多様なエージェントハーネスにおいて高い堅牢性を示すよう訓練されている。異なるハーネス環境における汎化能力を高めるため、第二SFT段階で少量の追加ベンチマークハーネスデータを組み込んだ。これにより、OpenCodeハーネスでの評価において10%の性能向上が得られ、SWE-Agentでの性能を維持しつつ、クロスハーネス転移が効率的に達成されることが示された。


参考: Hugging Face Blog — 2026年6月9日 16:43 (JST)

この記事をシェア
X はてブ LinkedIn