RESEARCH27
On Effectiveness and Efficiency of Agentic Tool-calling and RL Training
arXiv CS.LG·2. Juni 2026
Dieses Papier untersucht das Tool-Calling in großen Sprachmodell-Agenten (LLMs) hinsichtlich Effektivität und Effizienz. Es zeigt, dass Evaluationspipelines sensibel auf Implementierungsentscheidungen reagieren und identifiziert Rechenverschwendung beim Reinforcement Learning-Training.
Original lesen ↗