← heapsort-ai

Monte Carlo Tree Search

1 items

RESEARCHarXiv CS.AI·20/04/2026

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

Esta pesquisa propõe uma estrutura de otimização de dois níveis para aprimorar sistematicamente as "habilidades de agente" em agentes de modelos de linguagem grandes (LLMs). Ela utiliza uma iteração externa de Monte Carlo Tree Search para otimizar conjuntamente a estrutura e o conteúdo dessas habilidades, visando melhorar o desempenho das tarefas.

27