RESEARCH27

Harnesses for Inference-Time Alignment over Execution Trajectories

arXiv CS.LG·23 mai 2026

Cette recherche étudie l'ingénierie des harnais comme technique d'inférence pour les agents de grands modèles linguistiques (LLM), visant à améliorer les performances à long terme par la décomposition des tâches et l'exécution guidée. Elle quantifie l'impact des éléments de conception tels que la granularité du flux de travail et l'orientation sur les performances, révélant des modes de défaillance courants comme la surdécomposition et l'exécution hallucinatoire.

inference LLMs machine learning Task Decomposition AI agents

Lire l'original ↗