heapsort
RESEARCH27

On Effectiveness and Efficiency of Agentic Tool-calling and RL Training

arXiv CS.LG·2 de junio de 2026

Este artículo estudia la llamada a herramientas en agentes de modelos de lenguaje grandes (LLM), analizando su efectividad y eficiencia. Demuestra que las evaluaciones son sensibles a las decisiones de implementación y señala el desperdicio computacional en el entrenamiento de aprendizaje por refuerzo.

Leer original