RESEARCH27
Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
arXiv CS.AI·20 de abril de 2026
Esta investigación propone un marco de optimización de dos niveles para mejorar sistemáticamente las "habilidades de agente" en agentes de modelos de lenguaje grandes (LLM). Utiliza un bucle externo de Monte Carlo Tree Search para optimizar conjuntamente la estructura y el contenido de estas habilidades, buscando mejorar el rendimiento de la tarea.
Leer original ↗