RESEARCH28
Position: Deployed Reinforcement Learning should be Continual
arXiv CS.LG·4 de junho de 2026
Este artigo de posição argumenta que agentes de Aprendizagem por Reforço (RL) implementados devem se envolver em aprendizagem contínua, em vez de um paradigma de treinar e depois corrigir. Ele identifica quatro fontes de não-estacionaridade pós-implementação, destacando a necessidade de os agentes se adaptarem continuamente para alcançar desempenho ótimo em cenários do mundo real.
Ler original ↗