ReSum、自己要約でLLM推論効率向上 平均4%性能改善
arxiv.orgは6月11日(現地時間)、大規模言語モデル (LLM) の推論効率を高める新たなフレームワーク「ReSum」に関する論文を発表した。この研究は、既存の強化学習検証可能報酬 (Reinforcement Learning with Verifiable Rewards: RLVR) における推論の冗長性に着目。LLMが自身の推論軌跡を自己要約することで、推論の無駄を削減し、性能向上を実現したと報告している。実験では、平均4%の性能向上と18.6%の推論長さ削減を達成した。