RESEARCH28
TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination
arXiv CS.LG·18 de maio de 2026
Este artigo propõe o TeamTR, um framework de trust-region para ajustar sistemas LLM multiagente, abordando falhas estruturais em ajustes sequenciais. Ele prova que a avaliação de ocupação desatualizada penaliza quadraticamente com o número de agentes e melhora o desempenho em 7,1% em média.
Ler original ↗