RESEARCH27

Harnesses for Inference-Time Alignment over Execution Trajectories

arXiv CS.LG·23. Mai 2026

Diese Forschung untersucht Harness Engineering als Inferenzzeit-Technik für große Sprachmodell-Agenten (LLM), um die Langzeit-Performance durch Aufgabenzerlegung und geführte Ausführung zu verbessern. Sie quantifiziert, wie Designelemente wie Workflow-Granularität und Führung die Leistung beeinflussen, und deckt gängige Fehlerursachen wie Überzerlegung und halluzinierte Ausführung auf.

inference LLMs machine learning Task Decomposition AI agents

Original lesen ↗