heapsort
RESEARCH27

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

arXiv CS.AI·20 de abril de 2026

Esta pesquisa propõe uma estrutura de otimização de dois níveis para aprimorar sistematicamente as "habilidades de agente" em agentes de modelos de linguagem grandes (LLMs). Ela utiliza uma iteração externa de Monte Carlo Tree Search para otimizar conjuntamente a estrutura e o conteúdo dessas habilidades, visando melhorar o desempenho das tarefas.

Ler original