heapsort
RESEARCH28

Position: Deployed Reinforcement Learning should be Continual

arXiv CS.LG·4 de junho de 2026

Este artigo de posição argumenta que agentes de Aprendizagem por Reforço (RL) implementados devem se envolver em aprendizagem contínua, em vez de um paradigma de treinar e depois corrigir. Ele identifica quatro fontes de não-estacionaridade pós-implementação, destacando a necessidade de os agentes se adaptarem continuamente para alcançar desempenho ótimo em cenários do mundo real.

Ler original