RESEARCH28
Position: Deployed Reinforcement Learning should be Continual
arXiv CS.LG·4. Juni 2026
Dieses Positionspapier argumentiert, dass eingesetzte Reinforcement Learning (RL)-Agenten kontinuierliches Lernen betreiben sollten, anstatt einem Train-then-Fix-Paradigma zu folgen. Es identifiziert vier Quellen der Nicht-Stationarität nach der Bereitstellung und betont die Notwendigkeit, dass Agenten sich kontinuierlich anpassen, um optimale Leistung in realen Szenarien zu erzielen.
Original lesen ↗