heapsort
RESEARCH27

On Effectiveness and Efficiency of Agentic Tool-calling and RL Training

arXiv CS.LG·2 de junho de 2026

Este artigo estuda a chamada de ferramentas em agentes de modelos de linguagem grandes (LLMs), focando na sua eficácia e eficiência. Ele analisa pipelines de avaliação, mostrando que os resultados são sensíveis a escolhas de implementação, e identifica desperdício computacional no treinamento de aprendizado por reforço.

Ler original