← heapsort-ai

Trust-region method

1 items

RESEARCHarXiv CS.LG·vor 22T

TeamTR: Trust-Region Fine-Tuning for Multi-Agent LLM Coordination

Dieses Papier stellt TeamTR vor, ein Trust-Region-Framework zur Feinabstimmung von Multi-Agenten-LLM-Systemen, das strukturelle Fehler bei der sequentiellen Feinabstimmung adressiert. Es beweist, dass eine veraltete Belegungsevaluation eine quadratische Strafe mit der Anzahl der Agenten nach sich zieht und die Leistung im Durchschnitt um 7,1% verbessert.

28