学術論文投稿サイトarXivは2026年6月25日(現地時間)に公開した研究論文において、統計物理学における分子システムの効率的なサンプリングを目的とした新たなモデリングフレームワーク「Autoregressive Boltzmann Generators (ArBG)」を発表した。ArBGは、従来のBoltzmann Generators (BGs)が抱える表現力の制約や計算コストの課題を克服するため、Large Language Modelsのアーキテクチャを活用する。10残基のChignolinなどの大型ペプチドシステムで従来のフローベースモデルを大幅に改善し、1億3200万パラメータを持つ転送可能なモデル「Robin」は8残基システムにおけるゼロショットエネルギー誤差E-W$_2$を60%以上削減した。
統計物理学において、熱力学的平衡状態にある分子システムの効率的なサンプリングは、長年の課題とされてきた。この課題に対し、生成モデルと正確な尤度、重要度サンプリング補正を組み合わせることで、無相関な平衡サンプルを迅速に生成するBoltzmann Generators (BGs) が開発されてきた。しかし、現代のBGsは主にnormalizing flows (NFs) に依存しており、厳密な可逆性制約による表現力の限界や、計算コストの高い尤度計算といった課題に直面していた。
今回、Danyal Rehman (ダニヤル・レーマン) 氏、Charlie B. Tan (チャーリー・B・タン) 氏、Yoshua Bengio (ヨシュア・ベンジオ) 氏、Avishek Joey Bose (アヴィシェク・ジョーイ・ボーズ) 氏、Alexander Tong (アレクサンダー・トン) 氏らの研究チームは、フローベースのBGパラダイムから脱却し、これらの限界を克服するAutoregressive Boltzmann Generators (ArBG)を提案した。ArBGは、フローの位相的制約を回避し、シーケンシャルな推論時介入を可能にする。また、Large Language Models (LLM) で効果的なアーキテクチャを活用することで、スケーラビリティを向上させる。
ArBGは、全てのベンチマークにおいてフローベースモデルに対する大幅な改善をもたらしたと研究チームは述べている。特に10残基のChignolinのような大型ペプチドシステムにおいて顕著な性能向上が見られた。さらに、ArBGフレームワークで訓練された1億3200万パラメータを持つ転送可能なモデル「Robin」を導入し、8残基システムにおけるゼロショットエネルギー誤差E-W$_2$を従来の最先端技術から60%以上削減した。この研究はICML 2026のSpotlight発表に選出されており、関連コードはGitHubにて公開されている。
参考: arXiv cs.LG (アーカイブ) — 2026年6月26日 02:58 (JST)
原文ハイライト"Autoregressive Boltzmann Generators (ArBG) -- a novel autoregressive modelling framework"