heapsort
RESEARCH28

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

arXiv CS.LG·18 de mayo de 2026

Este artículo propone TeamTR, un marco de región de confianza para el ajuste fino de sistemas LLM multiagente, abordando fallas estructurales en el ajuste secuencial. Demuestra que la evaluación de ocupación obsoleta incurre en una penalización cuadrática con el número de agentes y mejora el rendimiento en un 7,1% en promedio.

Leer original