RESEARCHarXiv CS.LG·18d atrás
Harnesses for Inference-Time Alignment over Execution Trajectories
Esta pesquisa explora a engenharia de arneses como uma técnica de tempo de inferência para agentes de grandes modelos de linguagem (LLM), visando melhorar o desempenho a longo prazo através da decomposição de tarefas e execução guiada. O estudo quantifica como elementos de design como granularidade do fluxo de trabalho e orientação afetam o desempenho, revelando modos de falha comuns como superdecomposição e execução alucinada.
27