heapsort
RESEARCH27

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

arXiv CS.AI·1 de junio de 2026

El estudio desentraña dos capacidades de agentes LLM autoevolutivos: la actualización del "harness" (producir actualizaciones útiles) y el beneficio del "harness" (aprovechar esas actualizaciones). El análisis muestra que la capacidad de actualización es sorprendentemente similar entre modelos de diversas capacidades base, lo que sugiere que incluso modelos menos potentes pueden generar actualizaciones beneficiosas.

Leer original