RESEARCHarXiv CS.LG·hace 21h
Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark
El aprendizaje por refuerzo offline es una ruta prometedora para desarrollar controladores de plasma a partir de datos históricos de tokamak. Se introduce RL4F, un benchmark para el aprendizaje por refuerzo offline en el control de plasma de fusión nuclear, evaluando líneas de base y encontrando que los métodos basados en modelos son los mejores.
46