深層研究エージェント多段階評価、限定的なフィードバック効果と課題
arXiv cs.AIは2026年6月8日(現地時間)、リシャブ・サバルワル氏らの研究チームが、深層研究エージェント(DRAs)の多段階評価に関する論文を公開した。既存の評価手法が単一出力のみに焦点を当て、フィードバックによるエージェントの改善能力を軽視している現状を指摘。本研究では、自己反省とプロセスレベルフィードバックという二つの設定下でDRAsの性能を詳細に評価し、多段階での確実な改善が依然として達成できていない現状を明らかにした。