← heapsort-ai

Task Decomposition

1 items

RESEARCHarXiv CS.LG·vor 18T

Harnesses for Inference-Time Alignment over Execution Trajectories

Diese Forschung untersucht Harness Engineering als Inferenzzeit-Technik für große Sprachmodell-Agenten (LLM), um die Langzeit-Performance durch Aufgabenzerlegung und geführte Ausführung zu verbessern. Sie quantifiziert, wie Designelemente wie Workflow-Granularität und Führung die Leistung beeinflussen, und deckt gängige Fehlerursachen wie Überzerlegung und halluzinierte Ausführung auf.

27