Microsoft Researchは6月30日(現地時間)、AIエージェントのスキルを訓練可能なパラメータとして最適化する新たな手法「スキルオプト (SkillOpt)」を発表しました。SkillOptは、エージェントの指示やスキルを手動調整の限界を超えて扱い、基盤モデルの重みを変更することなく、エージェントの動作をより信頼性が高く、効果的なものにすることを目指します。これにより、AIエージェント開発における新たなアプローチを提示します。
スキルオプト (SkillOpt) は、エージェントスキルファイルを凍結されたターゲットモデルの外部にある訓練可能なパラメータとして扱います。これにより、従来のスキル作成がワンショットプロンプティングに依存していた状況から、制御された最適化プロセスへと移行します。
評価は、SearchQA、SpreadsheetBench、OfficeQA、DocVQA、LiveMathematicianBench、ALFWorldの6つのベンチマーク、GPT-5.5からQwen3.5-4Bまでの7つのターゲットモデル、およびdirect chat、Codex、Claude Codeの3つの実行モードにわたり実施されました。合計52の評価セル全てにおいて、SkillOptは最良またはタイで最良の結果を達成しています。特に、GPT-5.5のdirect chatモードでは、6ベンチマーク平均が58.8から82.3へと23.5ポイントの向上を示しました。
SkillOptは、小規模モデルやオープンウェイトモデルとフロンティアモデルとの間の性能差の縮小にも寄与します。例えば、最適化されたGPT-5.4-miniの6ベンチマーク平均(64.3)は、より大きなGPT-5.4のスキルなしベースライン(59.7)を上回りました。最適化されたスキルファイルは、モデルスケール、エージェントハーネス、関連タスク間で転移可能であり、特定のモデルやベンチマークに過剰適合することなく、再利用可能なタスク解決手順を捉えることができます。展開される成果物であるbest_skill.mdはコンパクトで監査可能であり、最終ファイルは数少ない編集で成り立っています。
SkillOptのアプローチは、既存のプロンプトエンジニアリング、ファインチューニング、LoRAのような最適化手法と異なる構造的含意を持ちます。特に、基盤モデルの重みを凍結したまま外部のスキルパラメータを最適化する点は、大規模モデルの再訓練や追加訓練にかかるコストと複雑さを大幅に削減する可能性を示唆します。これにより、限られたリソース下でもエージェントの性能を向上させることができ、プロンプトエンジニアリングの手動調整では限界のある複雑なタスクに対しても、より体系的かつ自動化されたアプローチを提供します。この技術は、エージェントの能力を効率的に引き出し、堅牢で再利用可能なAIエージェントを開発する上で重要な選択肢となると見られます。
参考: Microsoft Research Blog — 2026年7月1日 01:50 (JST)