RESEARCH28
Position: Deployed Reinforcement Learning should be Continual
arXiv CS.LG·4 juin 2026
Cet article de position soutient que les agents d'apprentissage par renforcement (RL) déployés devraient s'engager dans un apprentissage continu plutôt que dans un paradigme d'entraînement puis de correction. Il identifie quatre sources de non-stationnarité après le déploiement, soulignant la nécessité pour les agents de s'adapter continuellement pour atteindre des performances optimales dans des scénarios du monde réel.
Lire l'original ↗