heapsort
RESEARCH27

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

arXiv CS.AI·1 juin 2026

Cet article démêle deux capacités d'agents LLM auto-évolutifs : la mise à jour du "harness" (produire des mises à jour utiles) et le bénéfice du "harness" (profiter de ces mises à jour). L'analyse révèle que la capacité de mise à jour est étonnamment constante entre les modèles de différentes capacités de base, impliquant que même les modèles moins performants peuvent générer des mises à jour utiles.

Lire l'original