RESEARCH28

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

arXiv CS.LG·18 de maio de 2026

Este artigo propõe o TeamTR, um framework de trust-region para ajustar sistemas LLM multiagente, abordando falhas estruturais em ajustes sequenciais. Ele prova que a avaliação de ocupação desatualizada penaliza quadraticamente com o número de agentes e melhora o desempenho em 7,1% em média.

Multi-agent LLMs LLM coordination Trust-region method Fine-tuning AI Research

Ler original ↗