LLM「幻覚」検出、新手法「ファーストトークン信頼度」が低コストで高精度
arXiv cs.CLは5月6日(現地時間)、Mina Gabriel氏による研究論文が、大規模言語モデルにおける「幻覚」(Hallucination)検出の新たな手法「ファーストトークン信頼度 (phi_first)」の有効性を示したと報じた。この手法は、単一のグリーディデコードにおける最初の内容を持つ回答トークンの上位Kロジットの正規化エントロピーから算出される。従来のサンプリングベースの手法と比較し、低コストで同等以上の性能を発揮することが明らかになった。