大規模言語モデルに「睡眠」機能導入 長文処理の課題克服へ新メカニズム
arXiv 2026年5月25日(現地時間) 研究論文投稿サイトarXivは、大規模言語モデル(LLM)の長文処理における計算コスト増大の課題を克服する新メカニズムを提案する論文『Language Models Need Sleep』を公開した。提案されたのは、人間の睡眠に類似した「統合メカニズム」で、モデルが周期的に過去のコンテキスト情報を永続的な重みに変換し、一時的なキャッシュをクリアする。これにより、LLMが長期間の複雑なタスクを効率的かつ高性能に処理する可能性が示されている。