RESEARCH27
Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents
arXiv CS.AI·1 de junho de 2026
Este artigo investiga duas capacidades de agentes LLM autoevolutivos: a atualização do "harness" (produzir atualizações úteis) e o benefício do "harness" (tirar proveito dessas atualizações). A análise revela que a capacidade de atualização é consistente entre modelos de diferentes níveis de capacidade base, indicando que modelos menos potentes podem gerar atualizações úteis.
Ler original ↗