← heapsort-ai

Monte Carlo Tree Search

1 items

RESEARCHarXiv CS.AI·20/04/2026

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

Cette recherche propose un cadre d'optimisation à deux niveaux pour améliorer systématiquement les "compétences d'agent" des grands modèles de langage (LLM). Elle utilise une boucle externe de Monte Carlo Tree Search pour optimiser conjointement la structure et le contenu de ces compétences, afin d'améliorer la performance des tâches.

27