大規模言語モデルの推論を革新、新手法「RiM」発表 ワーキングメモリに着目
Lukas Aichberger氏とSepp Hochreiter氏は5月28日(現地時間)、大規模言語モデル(Large Language Models、LLM)の推論能力を向上させる新しい潜在的推論手法「Reasoning in Memory (RiM)」を発表した。この手法は、人間の認知におけるワーキングメモリの概念を取り入れ、中間思考の自己回帰生成に代わるメモリブロックを使用することで、計算効率の高い潜在的推論を実現する。