RESEARCH27
On Effectiveness and Efficiency of Agentic Tool-calling and RL Training
arXiv CS.LG·2 de junho de 2026
Este artigo estuda a chamada de ferramentas em agentes de modelos de linguagem grandes (LLMs), focando na sua eficácia e eficiência. Ele analisa pipelines de avaliação, mostrando que os resultados são sensíveis a escolhas de implementação, e identifica desperdício computacional no treinamento de aprendizado por reforço.
Ler original ↗