大規模言語モデル、自己検証蒸留で性能向上 AI研究論文がarXiv掲載
論文公開プラットフォームarXivのcs.CLカテゴリは2026年5月20日(現地時間)、トニー・リー (Tony Lee) 氏らが執筆した論文「Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline」を掲載した。本研究は、事前学習済み大規模言語モデル (LLM) が外部からのフィードバックなしに、ラベル付けされていないプロンプトのみで自己改善する新手法「Self-Verified Distillation」を提案。これにより数学、科学、コーディングといった推論分野でモデル性能の向上が報告されている。