heapsort
RESEARCH46

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

arXiv CS.LG·9 de junho de 2026

A aprendizagem por reforço offline é promissora para desenvolver controladores de plasma a partir de dados históricos de tokamak. É introduzido o RL4F, um benchmark para aprendizagem por reforço offline para controle de plasma em fusão nuclear, avaliando baselines e descobrindo que métodos baseados em modelo são os melhores.

Ler original