RESEARCHarXiv CS.LG·hace 18d
Harnesses for Inference-Time Alignment over Execution Trajectories
Esta investigación examina la ingeniería de arneses como una técnica de tiempo de inferencia para agentes de modelos de lenguaje grandes (LLM), con el objetivo de mejorar el rendimiento a largo plazo mediante la descomposición de tareas y la ejecución guiada. Cuantifica cómo los elementos de diseño, como la granularidad del flujo de trabajo y la orientación, afectan el rendimiento, revelando modos de falla comunes como la sobredescomposición y la ejecución alucinada.
27