heapsort
RESEARCH27

On Effectiveness and Efficiency of Agentic Tool-calling and RL Training

arXiv CS.LG·2. Juni 2026

Dieses Papier untersucht das Tool-Calling in großen Sprachmodell-Agenten (LLMs) hinsichtlich Effektivität und Effizienz. Es zeigt, dass Evaluationspipelines sensibel auf Implementierungsentscheidungen reagieren und identifiziert Rechenverschwendung beim Reinforcement Learning-Training.

Original lesen