heapsort
RESEARCH27

Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

arXiv CS.AI·20 avril 2026

Cette recherche propose un cadre d'optimisation à deux niveaux pour améliorer systématiquement les "compétences d'agent" des grands modèles de langage (LLM). Elle utilise une boucle externe de Monte Carlo Tree Search pour optimiser conjointement la structure et le contenu de ces compétences, afin d'améliorer la performance des tâches.

Lire l'original