← heapsort-ai

Multi-agent LLMs

1 items

RESEARCHarXiv CS.LG·il y a 22j

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

Cet article propose TeamTR, un cadre de région de confiance pour l'ajustement fin des systèmes LLM multi-agents, s'attaquant aux défaillances structurelles de l'ajustement séquentiel. Il prouve que l'évaluation de l'occupation obsolète entraîne une pénalité quadratique avec le nombre d'agents et améliore les performances de 7,1% en moyenne.

28