RESEARCH29
Personalizing Embodied Multimodal Large Language Model Agents over Long-term User Interactions
arXiv CS.AI·27 de mayo de 2026
Este artículo propone POLAR, un framework multimodal aumentado con memoria para agentes encarnados personalizados en interacciones de usuario a largo plazo. POLAR organiza interacciones previas en un grafo de conocimiento multimodal, capturando memoria semántica y episódica para guiar la ejecución de tareas encarnadas.
Leer original ↗