RESEARCHarXiv CS.AI·20/04/2026
Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
Esta pesquisa propõe uma estrutura de otimização de dois níveis para aprimorar sistematicamente as "habilidades de agente" em agentes de modelos de linguagem grandes (LLMs). Ela utiliza uma iteração externa de Monte Carlo Tree Search para otimizar conjuntamente a estrutura e o conteúdo dessas habilidades, visando melhorar o desempenho das tarefas.
27