RESEARCH46
Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark
arXiv CS.LG·9 de junio de 2026
El aprendizaje por refuerzo offline es una ruta prometedora para desarrollar controladores de plasma a partir de datos históricos de tokamak. Se introduce RL4F, un benchmark para el aprendizaje por refuerzo offline en el control de plasma de fusión nuclear, evaluando líneas de base y encontrando que los métodos basados en modelos son los mejores.
Leer original ↗