RESEARCH27
RAMP: Hybrid DRL for Online Learning of Numeric Action Models
arXiv CS.AI·13. April 2026
RAMP schlägt eine neuartige Strategie vor, um numerische Planungs-Aktionsmodelle online durch Umweltinteraktionen zu lernen, indem es Deep Reinforcement Learning (DRL), Aktionsmodell-Lernen und Planung integriert. Dies erzeugt eine positive Rückkopplungsschleife, in der die RL-Strategie Daten sammelt, um das Aktionsmodell zu verfeinern, während der Planer Pläne generiert, um die RL-Strategie weiter zu trainieren.
Deep Reinforcement LearningAction Model LearningNumeric Planningreinforcement learningAutomated Planning
Original lesen ↗