研究レベル数学問題を解くAIフレームワーク「RMA」発表 arXiv cs.AI
arXiv cs.AI は2026年5月19日(現地時間)、研究レベルの数学問題解決に特化したエージェント型フレームワーク「Research Math Agents (RMA)」を発表した。RMAは、長期間にわたる推論、文献に基づく根拠付け、および反復的な証明精製を必要とする高度な数学問題の自動推論を目指す。専門家による評価の結果、RMAは「First Proof」ベンチマークにおいて、GPT-5.2Rを含む既存の強力なベースラインを上回り、10問中8問の研究問題を解決し、論理的に健全で読みやすい証明を生成した。