RESEARCHarXiv CS.LG·22d atrás
TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination
Este artigo propõe o TeamTR, um framework de trust-region para ajustar sistemas LLM multiagente, abordando falhas estruturais em ajustes sequenciais. Ele prova que a avaliação de ocupação desatualizada penaliza quadraticamente com o número de agentes e melhora o desempenho em 7,1% em média.
28