RESEARCH27
The Last Harness You'll Ever Build
arXiv CS.AI·25 de abril de 2026
Esta investigación propone un marco de dos niveles para automatizar la laboriosa 'ingeniería de harness' requerida para agentes de IA desplegados en flujos de trabajo complejos y específicos de dominio. Presenta un 'Harness Evolution Loop' donde un Agente de Evolución modifica el harness de un agente trabajador basándose en evaluaciones adversarias.
Leer original ↗