heapsort
RESEARCH27

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

arXiv CS.AI·1 de junho de 2026

Este artigo investiga duas capacidades de agentes LLM autoevolutivos: a atualização do "harness" (produzir atualizações úteis) e o benefício do "harness" (tirar proveito dessas atualizações). A análise revela que a capacidade de atualização é consistente entre modelos de diferentes níveis de capacidade base, indicando que modelos menos potentes podem gerar atualizações úteis.

Ler original