RESEARCH28

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

arXiv CS.LG·18 mai 2026

Cet article propose TeamTR, un cadre de région de confiance pour l'ajustement fin des systèmes LLM multi-agents, s'attaquant aux défaillances structurelles de l'ajustement séquentiel. Il prouve que l'évaluation de l'occupation obsolète entraîne une pénalité quadratique avec le nombre d'agents et améliore les performances de 7,1% en moyenne.

Multi-agent LLMs LLM coordination Trust-region method Fine-tuning AI Research

Lire l'original ↗