RESEARCH27

Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

arXiv CS.AI·25. April 2026

Dieses Papier stellt COSPLAY vor, ein Ko-Evolutions-Framework zur Verbesserung der Entscheidungsfindung von LLMs in Langzeitaufgaben. Es ermöglicht einem LLM-Agenten, Fähigkeiten aus einer lernbaren Fähigkeitenbank abzurufen, während eine Agenten-Pipeline wiederverwendbare Fähigkeiten aus ihren eigenen ungelabelten Rollouts entdeckt und speichert.

LLMs reinforcement learning Skill Discovery AI agents

Original lesen ↗