tool use

21 items

ARTICLEDEV.to AI·hace 1d

Anthropic API: Claude, Tool Use, and Structured Outputs in Apps

Esta publicación detalla el uso de la API de Mensajes de Anthropic para Claude, abordando las llamadas a herramientas para acciones estructuradas y la necesidad de validación de argumentos. También enfatiza la importancia de prácticas de seguridad como la rotación de claves y el monitoreo del uso de tokens.

Claude security API Anthropic

ARTICLEDEV.to AI·20/4/2026

30 Days of MCP in Production: What Actually Works (And What Breaks)

El artículo detalla una experiencia de 30 días con servidores Model Context Protocol (MCP) de Anthropic en producción, revelando lo que funciona y lo que falla. El MCP se describe como un estándar para equipar a Claude con herramientas persistentes y compartibles.

Model Context Protocol Claude Anthropic tool use

ARTICLEDEV.to AI·hace 6d

Anthropic API: Claude, Tool Use, and Structured Outputs in Apps

Esta publicación detalla la API de Mensajes de Anthropic, los modelos Claude y el uso de herramientas para acciones estructuradas en aplicaciones. Destaca la validación de argumentos, la necesidad de tratar la salida del modelo como no confiable y las prácticas de seguridad de la API.

Claude API Anthropic tool use

RESEARCHarXiv CS.AI·4/5/2026

Are Tools All We Need? Unveiling the Tool-Use Tax in LLM Agents

Esta investigación desafía la suposición de que el razonamiento con herramientas siempre mejora el rendimiento de los LLMs, demostrando que puede ser superado por CoT nativo debido a un "impuesto por uso de herramientas", especialmente con distractores semánticos. Se propone un marco de intervención factorizado para analizar esto y se introduce G-STEP como mitigación parcial para errores inducidos por el protocolo.

LLM Agents Reasoning AI performance tool use

RESEARCHarXiv CS.AI·4/5/2026

AgentFloor: How Far Up the tool use Ladder Can Small Open-Weight Models Go?

Este trabajo presenta AgentFloor, un benchmark determinista de 30 tareas organizado como una escala de capacidad de seis niveles para evaluar el uso de herramientas en modelos de IA. Los resultados revelan que los modelos de peso abierto pequeños y medianos son suficientes para gran parte del trabajo estructurado de uso de herramientas a corto plazo en los sistemas de agentes reales.

Open-Weight Models LLMs Benchmarking tool use

ARTICLEDEV.to AI·hace 13d

tool_use and function_calling for AI agent marketplaces in 2026 [24263]

El futuro de los ecosistemas de agentes de IA en 2026 dependerá de protocolos estandarizados de uso de herramientas y llamada de funciones, con el Model Context Protocol (MCP) impulsando el descubrimiento e implementación de agentes. Las transacciones en estos mercados utilizarán encabezados HTTP x402 y stablecoins USDC en la cadena Base para liquidaciones instantáneas y de bajo costo.

Marketplaces Function Calling tool use Protocols

DOCDEV.to AI·26/4/2026

Resolve a web-search capability in three calls

Este contenido aborda las complejidades de los agentes de IA al usar herramientas externas, destacando los pasos a menudo omitidos de identificación de capacidades, proveedores, costos y credenciales. Presenta Rhumb, que utiliza "Index" y "Resolve" para gestionar estos pasos, demostrando con ejemplos cURL la resolución previa y la estimación de costos para búsquedas web.

web search API Management tool use developer tools

DOCDEV.to AI·22/4/2026

How to use Claude's tool use (function calling) in Node.js — with real examples

Este tutorial explica cómo utilizar la función de uso de herramientas (function calling) de Claude en Node.js, permitiendo que la IA llame a funciones externas para ofrecer respuestas mejoradas. Cubre el ciclo completo desde la definición de las herramientas hasta que Claude las ejecuta y utiliza los resultados, con ejemplos reales.

Claude Function Calling API Node.js

DOCDEV.to AI·hace 13d

MCP server discovery — how Claude and Cursor find your tools [28760]

El Protocolo de Contexto del Modelo (MCP) permite que modelos de IA como Claude y Cursor descubran e invoquen herramientas externas de forma dinámica. Los servidores MCP modernos también pueden monetizar a través de x402 y USDC en la cadena Base para pagos autónomos de servicios de agentes.

MCP Function Calling tool use AI development

ARTICLEDEV.to AI·hace 23d

Anthropic API: Claude, Tool Use, and Structured Outputs in Apps

Esta publicación detalla la API de Mensajes de Anthropic, los modelos Claude y el uso de llamadas a herramientas para acciones estructuradas dentro de las aplicaciones. Destaca la importancia de la validación de entrada, de tratar la salida del modelo como no confiable y de prácticas cruciales de seguridad de la API, como la rotación de claves y el monitoreo del uso.

Claude API Anthropic tool use

RESEARCHDEV.to AI·7/5/2026

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

ReTool introduce un novedoso marco de aprendizaje por refuerzo diseñado para mejorar las capacidades estratégicas de uso de herramientas en Grandes Modelos de Lenguaje. Este enfoque busca optimizar cómo los LLM seleccionan y utilizan herramientas externas para resolver tareas complejas de manera más efectiva y eficiente.

LLMs reinforcement learning machine learning tool use

ARTICLEDEV.to AI·hace 28d

Tool Use Patterns: Function Calling, Structured Tools, Multi-Step Reasoning

Este artículo explora el uso de herramientas, o 'function calling', que permite a los LLMs interactuar con sistemas externos y actuar como agentes autónomos. Detalla los patrones esenciales para definir, invocar y encadenar llamadas de herramientas en sistemas de producción.

LLMs production systems Function Calling tool use

ARTICLEDEV.to AI·18/4/2026

I thought I had a bug

Un desarrollador de IA notó que su modelo generaba botones de acción con etiquetas personalizadas como "Luchar contra el Hombre Cabra" adjuntas a tipos de acción existentes irrelevantes. El problema no era un error, sino que la IA inventaba creativamente una función de "respuesta rápida" reutilizando los elementos de la interfaz de usuario disponibles.

LLM behavior tool use AI development

ARTICLEDEV.to AI·4/5/2026

Tool-Result Truncation: The Silent Bug That Makes Agents Lie

El artículo describe la "truncación de resultados de herramientas", un error silencioso en los agentes de IA donde las salidas de las herramientas se cortan, haciendo que el agente proporcione información incorrecta. Este modo de falla es costoso en agentes de producción y ocurre sin un error explícito.

bugs LLMs Reliability tool use

RESEARCHarXiv CS.CL·hace 25d

VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use

VectraYX-Nano es un modelo de lenguaje en español de 42 millones de parámetros entrenado desde cero para ciberseguridad, con enfoque latinoamericano e invocación nativa de herramientas. Esta investigación detalla su corpus personalizado de 170 millones de tokens, su arquitectura Transformer y una metodología de aprendizaje curricular con replay.

cybersecurity security language model curriculum learning

RESEARCHarXiv CS.CL·hace 27d

The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models

El Modelo Bicameral acopla dos modelos de lenguaje preentrenados y congelados mediante una interfaz neuronal entrenable en sus estados ocultos intermedios, permitiéndoles operar en sincronía. Este método permite que un modelo principal dirija una tarea mientras un modelo auxiliar utiliza herramientas o resuelve restricciones, mejorando significativamente la precisión en tareas como la aritmética y los rompecabezas de lógica.

neural networks language models AI models Model Architecture

DOCDEV.to AI·16/4/2026

Claude API Tool Use: Building Reliable Agentic Workflows in Production

Este contenido explica cómo aprovechar la API de uso de herramientas (llamada a funciones) de Claude para desarrollar agentes de IA confiables adecuados para entornos de producción. Destaca la distinción de los chatbots básicos e incluye un ejemplo de código para definir herramientas.

Production AI Claude API Function Calling tool use

RESEARCHHugging Face Blog·15/4/2026

Inside VAKRA: Reasoning, Tool Use, and Failure Modes of Agents

Este contenido profundiza en VAKRA, un sistema de agentes de IA, examinando sus procesos de razonamiento, cómo utiliza herramientas y los diversos modos en los que puede fallar. Proporciona información sobre las características operacionales y limitaciones de los agentes de IA avanzados.

failure modes VAKRA Reasoning tool use

RESEARCHarXiv CS.AI·23/4/2026

The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge?

Este artículo revela el fenómeno generalizado del "uso excesivo de herramientas" en LLMs, donde los modelos emplean herramientas externas innecesariamente. Identifica una "ilusión epistémica del conocimiento" y propone una estrategia basada en la optimización de preferencia directa que reduce el uso de herramientas en un 82,8% y mejora la precisión.

LLMs Knowledge Representation Reasoning model behavior

RESEARCHarXiv CS.AI·6/5/2026

CreativityBench: Evaluating Agent Creative Reasoning via Affordance-Based Tool Repurposing

Este artículo presenta CreativityBench, un nuevo benchmark para evaluar la capacidad de razonamiento creativo de los LLM mediante la reutilización de herramientas basada en affordances. Detalla la construcción de una base de conocimiento de affordances a gran escala y la generación de 14 mil tareas que requieren soluciones no obvias pero físicamente plausibles.

AI Creativity Benchmarking AI Reasoning tool use