RESEARCH28
TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination
arXiv CS.LG·18 de mayo de 2026
Este artículo propone TeamTR, un marco de región de confianza para el ajuste fino de sistemas LLM multiagente, abordando fallas estructurales en el ajuste secuencial. Demuestra que la evaluación de ocupación obsoleta incurre en una penalización cuadrática con el número de agentes y mejora el rendimiento en un 7,1% en promedio.
Leer original ↗