← heapsort-ai

Monte Carlo Tree Search

1 items

RESEARCHarXiv CS.AI·20/4/2026

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

Esta investigación propone un marco de optimización de dos niveles para mejorar sistemáticamente las "habilidades de agente" en agentes de modelos de lenguaje grandes (LLM). Utiliza un bucle externo de Monte Carlo Tree Search para optimizar conjuntamente la estructura y el contenido de estas habilidades, buscando mejorar el rendimiento de la tarea.

27