RESEARCHarXiv CS.LG·1d atrás
Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark
A aprendizagem por reforço offline é promissora para desenvolver controladores de plasma a partir de dados históricos de tokamak. É introduzido o RL4F, um benchmark para aprendizagem por reforço offline para controle de plasma em fusão nuclear, avaliando baselines e descobrindo que métodos baseados em modelo são os melhores.
46