RESEARCH27
RAMP: Hybrid DRL for Online Learning of Numeric Action Models
arXiv CS.AI·13 de abril de 2026
RAMP propõe uma nova estratégia para aprender modelos de ação de planejamento numérico online através de interações ambientais, integrando DRL, aprendizado de modelo de ação e planejamento. Isso cria um loop de feedback positivo onde a política de RL coleta dados para refinar o modelo de ação, enquanto o planejador gera planos para continuar treinando a política de RL.
Deep Reinforcement LearningAction Model LearningNumeric Planningreinforcement learningAutomated Planning
Ler original ↗