heapsort
RESEARCH27

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

arXiv CS.AI·1. Juni 2026

Diese Studie entwirrt zwei Fähigkeiten selbstentwickelnder LLM-Agenten: die Fähigkeit zur "harness"-Aktualisierung (nützliche Updates zu produzieren) und die Fähigkeit, von diesen "harness"-Updates zu profitieren. Die Analyse zeigt, dass die Aktualisierungsfähigkeit über verschiedene Modellkapazitäten hinweg überraschend konstant ist, was darauf hindeutet, dass auch weniger leistungsfähige Modelle nützliche Updates erstellen können.

Original lesen