Microsoftは2026年6月1日(現地時間)、新しいコーディングモデル「MAI-Code-1-Flash」を発表した。このモデルはMicrosoftによって独自に開発され、適切にライセンスされたデータのみを使用して構築されている。MAI-Code-1-Flashは、Visual Studio Codeを利用するGitHub Copilotの個人ユーザー向けに、モデルピッカーおよびデフォルトの自動ピッカーを通じて現在展開が進められている。
MAI-Code-1-Flashは、開発者の日常的なワークフローにおける高速で効率的な支援を目的としている。同社は、Claude Haiku 4.5と比較して、コーディングベンチマーク全体でパフォーマンスあたりの価格において優位性があると説明している。
本モデルは、ベンチマークスコアの最適化だけでなく、開発者が日常的に使用する実環境での性能を重視して構築された。開発段階では、プロダクションで使われるGitHub Copilotのハーネスで直接訓練され、エージェント的なコーディングタスクにおいて周辺ツールやシステムと連携する方法を学習した。評価は、コアソフトウェアエンジニアリングタスク、リポジトリ質問応答、リファクタリング、実際のGitHub Copilot利用に基づくテレメトリーデータを使用して行われた。
MAI-Code-1-Flashは、適応的な解決長制御機能を備えており、タスクに応じて応答の深さを調整する。シンプルな要求には簡潔に、より深い分析や広範なコード変更が必要な問題には、より多くの推論リソースを割り当てる。これにより、より困難な問題を最大60%少ないトークンで解決できるとされており、レイテンシ(遅延)の削減、コストの低減、トークンあたりのリターンの向上が期待される。
ベンチマーク評価では、MAI-Code-1-FlashはSWE-Bench Verified、SWE-Bench Pro、SWE-Bench Multilingual、Terminal Bench 2を含む全ての主要なコーディングベンチマークにおいて、Claude Haiku 4.5を上回る結果を示した。特にSWE-Bench Proでは51.2%の通過率を記録し、Claude Haiku 4.5の35.2%を16ポイント上回った。また、SWE-Bench Verifiedでは、最大60%少ないトークンでより困難な問題を解決したと報告されている。さらに、数学、科学、視覚生成コーディングのコア推論能力においても、Claude Haiku 4.5を凌駕している。
参考: microsoft.ai — 2026年6月2日 14:42 (JST)
原文ハイライト"built end-to-end by Microsoft using clean and appropriately licensed data."