RESEARCH27
RAMP: Hybrid DRL for Online Learning of Numeric Action Models
arXiv CS.AI·13 de abril de 2026
RAMP propone una estrategia novedosa para aprender modelos de acción de planificación numérica en línea a través de interacciones con el entorno, integrando DRL, aprendizaje de modelos de acción y planificación. Esto crea un ciclo de retroalimentación positiva donde la política de RL recopila datos para refinar el modelo de acción, mientras que el planificador genera planes para continuar entrenando la política de RL.
Deep Reinforcement LearningAction Model LearningNumeric Planningreinforcement learningAutomated Planning
Leer original ↗