大規模言語モデルの内省能力評価に一石、先行研究の結論に疑問呈する研究
arXiv cs.AIは2026年5月25日(現地時間)、大規模言語モデル(LLM)の内省能力に関する研究論文「Can LLMs Introspect? A Reality Check」を発表した。Shashwat Singh、Tal Linzen、Shauli Ravfogelの3氏によるこの研究は、多くの先行研究がLLMの内省能力を肯定してきたことに対し、その結論は時期尚早である可能性を指摘。人間のメタ認知研究からの知見に基づき、真の内省と表面的なパターンマッチングを厳密に区別する必要性を強調し、行動証拠だけでは内省能力を強く主張するには不十分であると論じている。