Multi-agent LLMs — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.LG·22d atrás

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

Este artigo propõe o TeamTR, um framework de trust-region para ajustar sistemas LLM multiagente, abordando falhas estruturais em ajustes sequenciais. Ele prova que a avaliação de ocupação desatualizada penaliza quadraticamente com o número de agentes e melhora o desempenho em 7,1% em média.

Multi-agent LLMs LLM coordination Trust-region method Fine-tuning