RESEARCH28
Position: Deployed Reinforcement Learning should be Continual
arXiv CS.LG·4 de junio de 2026
Este artículo de posición argumenta que los agentes de Aprendizaje por Refuerzo (RL) desplegados deberían participar en un aprendizaje continuo en lugar de un paradigma de entrenar y luego corregir. Identifica cuatro fuentes de no estacionariedad después del despliegue, resaltando la necesidad de que los agentes se adapten continuamente para lograr un rendimiento óptimo en escenarios del mundo real.
Leer original ↗