拡散言語モデルのトークン編集精度向上、自己生成エラー学習で実現

arXiv cs.CLは6月15日(現地時間)、リン・ヤオ (Lin Yao) 氏による研究論文「Self-Generated Error Training for Token Editing in Diffusion Language Models」を公開した。本論文は、拡散言語モデル (Diffusion Language Models) におけるトークン編集の精度を高める新たな手法を提案している。特に、LLaDA2.1を用いたブロック拡散デコーディングプロセス中に確定されたトークンを修正するトークン間 (T2T) 編集が抱える課題に対応する。

リン・ヤオ氏の研究は、既存のT2Tエディタが訓練時に直面する「訓練と推論のミスマッチ」という根本的な問題を指摘している。これまでのT2Tエディタは、ランダムに生成された語彙の破損（無作為な単語の置き換えや削除など）を用いて訓練されてきた。しかし、実際の推論段階では、モデル自身が生成する流暢で高い確信度を持つドラフトエラー、つまり、表面上は自然に見えるが内容的には不正確な、より巧妙な誤りに直面する。この訓練環境と実際の運用環境との乖離が、エディタの性能を制限する要因となっていた。

この訓練と推論のミスマッチを解消するため、論文では「自己生成T2T」という新しいアプローチを提案している。この手法では、まずno-gradientドラフトパスを実行し、拡散言語モデルが生成した予測トークンによってマスクされた位置を埋める。ここで生成される予測トークンは、モデル自身の内部的な誤り傾向を反映した「自己生成された破損」として機能する。次に、これらの自己生成された破損をデータとして利用し、2回目のパスで回復を監督する形でエディタを訓練する。このプロセスを通じて、エディタはより現実的なエラーパターン、すなわちモデル自身が生成する可能性のあるエラーを学習し、それらを修正する能力を向上させることを目指す。

本手法は、LLaDA2.1-miniモデルに対して、短期間のLoRA継続事前学習として実装され、その有効性が検証された。評価は公式のQ-Mode T2T手順と変更されていない推論パラメータを用いて、複数の標準ベンチマーク上で実施された。実験の結果、提案された自己生成T2Tは、既存の手法と比較して、一般的にトークン編集の精度を向上させることが示された。同時に、T2T編集強度の過度な適用を低減する効果も見られた。これにより、例えば文章の最終桁における転写エラーや、短い事実に関する質問への回答前に過剰な自己修正を行うといった、拡散言語モデルが陥りがちな特定の失敗モードを効果的に軽減できることが確認された。この研究は、拡散言語モデルの編集能力を実用レベルに引き上げるための重要な一歩となる可能性を示唆している。

参考: arXiv cs.CL — 2026年6月17日 13:00 (JST)