RESEARCH27
Bilevel Optimization of Agent Skills via Monte Carlo Tree Search
arXiv CS.AI·20 avril 2026
Cette recherche propose un cadre d'optimisation à deux niveaux pour améliorer systématiquement les "compétences d'agent" des grands modèles de langage (LLM). Elle utilise une boucle externe de Monte Carlo Tree Search pour optimiser conjointement la structure et le contenu de ces compétences, afin d'améliorer la performance des tâches.
Lire l'original ↗