RESEARCH27
On Effectiveness and Efficiency of Agentic Tool-calling and RL Training
arXiv CS.LG·2 juin 2026
Cet article étudie l'appel d'outils chez les agents de grands modèles de langage (LLM), en se penchant sur leur efficacité et leur efficience. Il révèle que les pipelines d'évaluation sont sensibles aux choix d'implémentation et identifie un gaspillage computationnel dans l'apprentissage par renforcement.
Lire l'original ↗