RESEARCH27

Harnesses for Inference-Time Alignment over Execution Trajectories

arXiv CS.LG·23 de maio de 2026

Esta pesquisa explora a engenharia de arneses como uma técnica de tempo de inferência para agentes de grandes modelos de linguagem (LLM), visando melhorar o desempenho a longo prazo através da decomposição de tarefas e execução guiada. O estudo quantifica como elementos de design como granularidade do fluxo de trabalho e orientação afetam o desempenho, revelando modos de falha comuns como superdecomposição e execução alucinada.

inference LLMs machine learning Task Decomposition AI agents

Ler original ↗