Apple、推論時フィードバックでエージェントを強化
米Appleは2026年5月(現地時間)、機械学習研究部門のウェブサイトで、ツール呼び出しエージェントの性能向上に関する研究論文「Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents」を発表した。この研究は、大規模言語モデル (LLM) を利用するエージェントにおける従来の事後評価の限界を克服するため、推論時の実行ループ内で評価を行う専門のレビュアーエージェントを導入する手法を提案している。