heapsort
RESEARCH27

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

arXiv CS.AI·20 de abril de 2026

Esta investigación propone un marco de optimización de dos niveles para mejorar sistemáticamente las "habilidades de agente" en agentes de modelos de lenguaje grandes (LLM). Utiliza un bucle externo de Monte Carlo Tree Search para optimizar conjuntamente la estructura y el contenido de estas habilidades, buscando mejorar el rendimiento de la tarea.

Leer original