← heapsort-ai

tool-calling

16 items

NEWS↑ trendingReddit r/LocalLLaMA·10/04/2026

More Gemma4 fixes in the past 24 hours

Este conteúdo relata correções recentes e novos templates de chat para os modelos Gemma 4 do Google, visando melhorar o orçamento de raciocínio e a chamada de ferramentas. Ele oferece instruções para usuários de llama.cpp sobre como aplicar esses novos templates para garantir o funcionamento correto.

36
ARTICLEDEV.to AI·10/04/2026

How We Evaluate AI Agents Before Recommending Them to Clients

Este artigo apresenta uma estrutura de avaliação de agentes de IA baseada na experiência de produção, enfatizando a importância de alinhar a ferramenta ao fluxo de trabalho em vez de focar apenas em benchmarks. Os critérios chave incluem confiabilidade com dados reais, qualidade da chamada de ferramentas, comportamento da janela de contexto para fluxos longos e custo em escala para determinar a viabilidade.

28
RESEARCHarXiv CS.CL·il y a 26j

ToolWeave: Structured Synthesis of Complex Multi-Turn Tool-Calling Dialogues

ToolWeave est un cadre structuré pour la synthèse de dialogues réalistes d'appel d'outils multi-tours, essentiel pour que les LLM fonctionnent comme des agents autonomes. Il résout les problèmes de génération de données synthétiques existants en prenant en charge les flux de travail multi-étapes et en réduisant les hallucinations de paramètres.

27
RESEARCHarXiv CS.AI·il y a 8j

MAVEN: Improving Generalization in Agentic Tool Calling

MAVEN (Modular Agentic Verification and Execution Network) est un échafaudage de raisonnement symbolique léger qui améliore la généralisation dans les environnements d'appel d'outils agentiques. Il a été évalué sur des benchmarks établis et introduit MAVEN-Bench, un nouveau benchmark de test de stress pour le raisonnement mathématique et physique en plusieurs étapes.

27
ARTICLEDEV.to AI·09/04/2026

One Model Provider Is a Toy Nowadays. Part 4/5

Este conteúdo aborda os desafios de construir agentes de IA reais que vão além de responder perguntas, necessitando de ações e ferramentas. Critica as limitações das APIs stateless, como a da Anthropic, que dificultam processos complexos de chamada de ferramentas e a manutenção de estado.

26
NEWSTogether AI Blog·18/03/2026

Together AI expands fine-tuning service with tool calling, reasoning, and vision support

Together AI a étendu son service de fine-tuning avec un support natif pour l'appel d'outils, le raisonnement et les modèles de vision-langage. Les améliorations comprennent également la formation de modèles de plus de 100 milliards de paramètres, un débit jusqu'à 6 fois supérieur, et des estimations de coût et de délai.

24