RESEARCH28
TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination
arXiv CS.LG·18. Mai 2026
Dieses Papier stellt TeamTR vor, ein Trust-Region-Framework zur Feinabstimmung von Multi-Agenten-LLM-Systemen, das strukturelle Fehler bei der sequentiellen Feinabstimmung adressiert. Es beweist, dass eine veraltete Belegungsevaluation eine quadratische Strafe mit der Anzahl der Agenten nach sich zieht und die Leistung im Durchschnitt um 7,1% verbessert.
Original lesen ↗