核融合プラズマ制御、オフラインRLに新ベンチマーク「RL4F」発表
arXiv cs.LGは2026年5月19日(現地時間)、核融合におけるプラズマ制御のための新しいオフライン強化学習(RL)ベンチマーク「RL4F」を導入したと報じた。実際の核融合装置を用いたプラズマ制御実験は、多大なコストと運用上のリスクを伴うため、データに基づいた効率的なコントローラー開発が求められている。この課題に対応するため、RL4Fは、過去に蓄積されたトカマク運転データからプラズマコントローラーを開発するオフラインRL手法の進捗を客観的に評価する基準を提供する。これまで、この分野ではアルゴリズムの性能を統一的に評価する標準化されたベンチマークが不足しており、開発の進捗測定と手法間の比較が困難であった。RL4Fは、閉ループ評価が可能な環境に加え、プラズマの回転、密度、温度、圧力という主要な4つのプロファイルを追跡するタスクを設定し、複数のベースライン手法による比較評価の枠組みを提供する。