パラメータ効率の良い継続学習「TailLoR」、モデル知識の主要成分保護へ

Marius Dragoi氏らは6月4日(現地時間)、人工知能モデルの継続学習において、パラメータ効率の高いファインチューニング手法の進展に寄与する新手法「TailLoR」に関する論文を発表した。この手法は、事前に学習された重みの特異基底UとVを固定参照フレームとして利用する点が特徴である。特異値行列に適用される低ランク更新を学習させることで、モデルの主要な知識の保護を目指す。

6月4日(現地時間)にMarius Dragoi氏、Ioana Pintilie氏、Alexandra Dragomir氏、Antonio Barbalau氏、Florin Brad氏によって共同執筆された論文は、人工知能(AI)モデルが連続的に新たなタスクを学習する際に直面する壊滅的忘却(catastrophic forgetting)という課題に取り組んでいる。特に、モデル全体のパラメータを再学習することなく効率的に適応させるパラメータ効率の良い継続学習の文脈で、この問題は顕著に現れる。

新手法「TailLoR」は、事前に学習されたモデルの重みを構成する特異値分解における特異基底UとVを、固定された参照フレームとして利用する。このアプローチにより、モデルは既存の学習済み知識構造を維持しつつ、新たな情報を取り入れるための低ランク更新を特異値行列に適用する。この更新の学習プロセスには、ソフトスペクトルペナルティが組み込まれている。

ソフトスペクトルペナルティは二つの主な役割を果たす。一つは、モデルの主要な特異方向、すなわち最も重要な学習済み知識や特徴と一致する更新を抑制することである。これにより、新しいタスクの学習が既存の主要な知識に干渉し、破壊的な影響を及ぼすリスクが低減される。もう一つの役割は、このペナルティが、より詳細で特異性の高い適応を、柔軟性の高いロングテイルスペクトル座標へと誘導することである。これにより、モデルは新たなタスクの細かいニュアンスや特殊な特徴を効果的に取り込みながら、全体としての安定性を保持することが可能となる。

論文の抄録によれば、「TailLoR」のこの二重のメカニズムは、「パラメータ効率の良い継続学習」において主要成分を保護することを目的としている。主要成分とは、モデルがこれまで獲得してきた知識の核心部分であり、これを維持しつつ新たな知識を積み重ねることは、汎用性と効率性を兼ね備えたAIシステムの開発において不可欠な要素とされる。本研究は、計算資源の制約がある環境下でのAIモデルの適応能力向上に貢献する。

参考: arXiv cs.LG — 2026年6月5日 02:59 (JST)