← heapsort-ai

Tokamak

1 items

RESEARCHarXiv CS.LG·23h atrás

Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark

A aprendizagem por reforço offline é promissora para desenvolver controladores de plasma a partir de dados históricos de tokamak. É introduzido o RL4F, um benchmark para aprendizagem por reforço offline para controle de plasma em fusão nuclear, avaliando baselines e descobrindo que métodos baseados em modelo são os melhores.

46