LLM開発で「文化データ漏斗」課題、学習偏りが多様性阻害と指摘
arXiv cs.CLは2026年6月11日(現地時間)、論文「The Culture Funnel: You Can't Align What isn't in the Data」を公開した。同論文は、大規模言語モデル (LLM) の文化アラインメント手法が、モデルに文化知識が十分あるとの誤った前提に立つと疑問を呈した。現代のLLM開発パイプラインが「cultural data funnel」と呼ぶ文化的データ偏りの問題に直面していると指摘している。