heapsort
RESEARCH27

SAT: Sequential Agent Tuning for Coordinator Free Plug and Play Multi-LLM Training with Monotonic Improvement Guarantees

arXiv CS.LG·8 de maio de 2026

Sequential Agent Tuning (SAT) é um novo paradigma de treinamento sem coordenador para equipes de LLMs menores, permitindo atualizações descentralizadas e escaláveis. Esta abordagem teórica garante melhoria monotônica na performance da equipe ao isolar a deriva de ocupação por agente.

Ler original