heapsort
RESEARCH27

On Effectiveness and Efficiency of Agentic Tool-calling and RL Training

arXiv CS.LG·2 juin 2026

Cet article étudie l'appel d'outils chez les agents de grands modèles de langage (LLM), en se penchant sur leur efficacité et leur efficience. Il révèle que les pipelines d'évaluation sont sensibles aux choix d'implémentation et identifie un gaspillage computationnel dans l'apprentissage par renforcement.

Lire l'original