RESEARCHarXiv CS.AI·25/4/2026
Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks
Este artículo presenta COSPLAY, un framework de co-evolución que mejora la toma de decisiones de los LLMs en tareas de largo plazo. Permite que un agente LLM recupere habilidades de un banco de habilidades aprendible mientras un pipeline de agente descubre y retiene nuevas habilidades de sus propias interacciones sin etiquetar.
27