RESEARCHarXiv CS.AI·20/04/2026
Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
Cette recherche propose un cadre d'optimisation à deux niveaux pour améliorer systématiquement les "compétences d'agent" des grands modèles de langage (LLM). Elle utilise une boucle externe de Monte Carlo Tree Search pour optimiser conjointement la structure et le contenu de ces compétences, afin d'améliorer la performance des tâches.
27