RESEARCH28
TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination
arXiv CS.LG·18 mai 2026
Cet article propose TeamTR, un cadre de région de confiance pour l'ajustement fin des systèmes LLM multi-agents, s'attaquant aux défaillances structurelles de l'ajustement séquentiel. Il prouve que l'évaluation de l'occupation obsolète entraîne une pénalité quadratique avec le nombre d'agents et améliore les performances de 7,1% en moyenne.
Lire l'original ↗