heapsort
RESEARCH27

The Last Harness You'll Ever Build

arXiv CS.AI·25 de abril de 2026

Esta investigación propone un marco de dos niveles para automatizar la laboriosa 'ingeniería de harness' requerida para agentes de IA desplegados en flujos de trabajo complejos y específicos de dominio. Presenta un 'Harness Evolution Loop' donde un Agente de Evolución modifica el harness de un agente trabajador basándose en evaluaciones adversarias.

Leer original