リサーチ・論文

LLM継続学習の可塑性-安定性ジレンマ、新フレームワーク「SETA」で克服へ

Fatema Siddika (ファテマ・シディカ) 氏らは2026年6月5日(現地時間)、大規模言語モデル (LLM) の継続学習における長年の課題である「可塑性-安定性のジレンマ」を解決する新しいフレームワーク「SETA (Mixture of Sparse Experts for Task Agnostic Continual Learning)」を発表した。このフレームワークは、知識をタスク固有のエキスパートモジュールに分離することで、既存の課題に対処し、モデルが新たな知識を獲得する際に以前の学習内容を忘却するのを防ぐとされている。

リサーチ・論文

大規模言語モデルの推論を革新、新手法「RiM」発表 ワーキングメモリに着目

Lukas Aichberger氏とSepp Hochreiter氏は5月28日(現地時間)、大規模言語モデル(Large Language Models、LLM)の推論能力を向上させる新しい潜在的推論手法「Reasoning in Memory (RiM)」を発表した。この手法は、人間の認知におけるワーキングメモリの概念を取り入れ、中間思考の自己回帰生成に代わるメモリブロックを使用することで、計算効率の高い潜在的推論を実現する。

リサーチ・論文

LLMの欺瞞能力、複雑な役割ゲームで課題露呈 ゲッティンゲン大学

ゲッティンゲン大学の研究チームは2026年4月9日(現地時間)、大規模言語モデル (LLM) の推論、説得、および欺瞞といった複雑な能力を評価する研究論文をarXiv cs.CLで発表した。ソーシャルディダクションゲーム「シークレット・ヒトラー」を検証に用いた結果、現在のLLMアーキテクチャは、多段階にわたる複雑な操作や欺瞞の維持において課題を抱えていることが示された。この研究は、AIの安全性とアラインメントの追求において重要な示唆を与える。