Open-Weight Models

2 items

RESEARCHarXiv CS.AI·04/05/2026

AgentFloor: How Far Up the tool use Ladder Can Small Open-Weight Models Go?

Este trabalho introduz o AgentFloor, um benchmark determinístico de 30 tarefas para avaliar a capacidade de uso de ferramentas de modelos de IA, organizadas em uma escada de seis níveis. Os resultados revelam que modelos abertos pequenos e de médio porte são suficientes para tarefas rotineiras de uso de ferramentas de curto prazo em pipelines de agentes.

Open-Weight Models LLMs Benchmarking tool use

ARTICLEKDNuggets·26d atrás

5 Small Language Models for Agentic Tool Calling

Este conteúdo destaca cinco modelos de linguagem pequenos e de peso aberto que são notáveis pelo seu suporte à chamada de ferramentas estruturada, tornando-os adequados para aplicações de agentes.

Open-Weight Models AI models LLMs tool-calling

5 Small Language Models for Agentic Tool Calling