← heapsort-ai

Skill Discovery

1 items

RESEARCHarXiv CS.AI·25/04/2026

Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

Cet article présente COSPLAY, un cadre de co-évolution visant à améliorer la prise de décision des LLM dans des environnements interactifs à long terme. Il permet à un agent LLM de récupérer des compétences d'une banque de compétences apprenable, tandis qu'un pipeline d'agent découvre et retient de nouvelles compétences à partir de ses propres expériences non étiquetées.

27