STRIDE、LLM訓練データ帰属を高速化 性能も向上
arXiv cs.LGは2026年6月3日(現地時間)、Rishit Dagli氏ら研究者グループが大規模言語モデル(LLM)の訓練データ帰属(TDA)に関する新たなフレームワーク「STRIDE」を開発したと報じた。STRIDEは、モデルの予測を訓練データに遡って追跡するTDAにおいて、既存手法と比較して性能を向上させ、処理速度を約13倍高速化することが示された。この新手法は、データ選択やデータ汚染の特定など、TDAの下流応用において実用的な有用性を持つと期待されている。