LLMs

724 items

RESEARCHarXiv CS.CL·20/4/2026

"Excuse me, may I say something..." CoLabScience, A Proactive AI Assistant for Biomedical Discovery and LLM-Expert Collaborations

CoLabScience se presenta como un asistente LLM proactivo para acelerar el descubrimiento biomédico mediante la mejora de la colaboración entre IA y expertos humanos. Utiliza PULI, un nuevo marco de aprendizaje por refuerzo para intervenciones oportunas, y también introduce BSDD, un nuevo conjunto de datos de diálogo de investigación simulado.

LLMs AI collaboration reinforcement learning datasets

ARTICLEDEV.to AI·26/4/2026

I Watched Google Cloud NEXT '26 ~ Here Is What Actually Matters for Developers

Aniruddha Adak, un ingeniero de agentes de IA, analizó Google Cloud NEXT 2026 para resaltar lo que realmente importa a los desarrolladores, distinguiendo el contenido útil del marketing. Ofrece su perspectiva honesta sobre sistemas agenticos y LLMs tras ver las conferencias.

LLMs cloud computing AI developer tools

ARTICLEDEV.to AI·hace 24d

Inside Naver Cloud: The AI Access Pioneer the West Hasn't Noticed

Mientras los gigantes tecnológicos globales compiten ferozmente en la 'fiebre del oro' de la IA, Naver Cloud de Corea del Sur está construyendo discretamente un ecosistema de IA completo y único. Esta iniciativa busca democratizar el acceso a potentes LLM y servicios de IA, centrándose en la eficiencia y la localización en lugar de solo la escala.

AI Democratization LLMs AI Naver Cloud

ARTICLEDEV.to AI·4/5/2026

The Hidden Cost of MCP: Why AI Agents Need Code Mode

El contenido aborda el costo oculto de que los agentes de IA carguen catálogos completos de herramientas en contexto, lo que eleva los costos y la latencia. Propone el "Modo Código" como solución, permitiendo a los agentes descubrir herramientas según sea necesario y orquestar flujos de trabajo mediante código, reduciendo el contexto y optimizando costos en producción.

AI architecture LLMs code mode cost optimization

RESEARCHDEV.to AI·7/5/2026

GPT-4.1 Hits 24.65% Derm Accuracy on Real Cases vs 42.25% Benchmarks

Un nuevo estudio demuestra que los modelos de lenguaje multimodal (LLMs) como GPT-4.1 muestran una caída significativa en la precisión diagnóstica en casos reales de dermatología hospitalaria, en comparación con los benchmarks públicos. La investigación, que abarcó 5.811 casos, reveló que GPT-4.1 alcanzó un 24,65% de precisión en entornos clínicos reales frente a un 42,25% en los benchmarks.

LLMs Healthcare Dermatology benchmarking

ARTICLEDEV.to AI·1/5/2026

Building Production-Grade Tools for AI Agents: What Works After 100 Deployments

Este artículo sostiene que el diseño de herramientas es más crítico que la ingeniería de prompts para la fiabilidad de los agentes de IA en producción, previniendo alucinaciones a nivel estructural. Basado en más de 100 implementaciones, promete compartir patrones concretos, ejemplos de código y anti-patrones para construir herramientas de IA robustas.

LLMs Production AI tool design AI agents

DOCDEV.to AI·hace 17d

Building a cost-efficient LLM caching layer in Python

Este tutorial explica cómo construir una capa de caché de LLM rentable en Python para reducir los costos de la API. Emplea coincidencias exactas con Redis y detección semántica de duplicados cercanos mediante similitud de coseno. Este enfoque puede generar ahorros mensuales sustanciales al evitar llamadas redundantes a la API.

LLMs Redis cost optimization Caching

ARTICLEDEV.to AI·1/5/2026

Your AI Agent Forgets Everything Between Sessions (Here's How to Fix It)

El artículo analiza el problema de los agentes de IA que olvidan el progreso entre sesiones, lo que lleva a la pérdida de tiempo al reexplicar el contexto. Recargar el historial de conversación es ineficaz debido a su tamaño masivo, el ruido excesivo y la falta de composición.

LLMs memory management AI agents

RESEARCHDEV.to AI·7/5/2026

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

ReTool introduce un novedoso marco de aprendizaje por refuerzo diseñado para mejorar las capacidades estratégicas de uso de herramientas en Grandes Modelos de Lenguaje. Este enfoque busca optimizar cómo los LLM seleccionan y utilizan herramientas externas para resolver tareas complejas de manera más efectiva y eficiente.

LLMs reinforcement learning machine learning tool use

RESEARCHarXiv CS.CL·21/4/2026

QU-NLP at QIAS 2026: Multi-Stage QLoRA Fine-Tuning for Arabic Islamic Inheritance Reasoning

El artículo presenta la estrategia de ajuste fino QLoRA multi-etapa de QU-NLP para el razonamiento de herencia islámica árabe, utilizando Qwen3-4B. El modelo logró una puntuación MIR-E del 90%, demostrando un rendimiento competitivo con recursos computacionales mínimos.

LLMs Legal AI Arabic AI NLP

ARTICLEDEV.to AI·10/5/2026

How To Select an Enterprise LLM

El artículo trata sobre la creciente competencia en la implementación de LLMs empresariales, destacando nuevos modelos de OpenAI y Mistral AI. Subraya la necesidad de un enfoque sistemático de benchmarking que considere la latencia, el costo y el rendimiento específico de la tarea, instando a las organizaciones a utilizar un marco de evaluación multifásico para alinear modelos con los objetivos comerciales.

LLMs model selection benchmarking AI deployment

ARTICLEDEV.to AI·30/4/2026

Building an AI Agent Harness from Scratch: The Architecture Between LLM and Agent

El artículo enfatiza el papel crucial del 'harness' o capa de orquestación para transformar un LLM en un agente de IA confiable. Argumenta que esta capa, que gestiona herramientas y estado, es lo que realmente diferencia a un agente robusto de una IA conversacional simple.

LLMs orchestration Architecture AI agents

DOCDEV.to AI·21/4/2026

Building a C# Agent with Microsoft Agent Framework and Ollama

Este contenido describe la creación de un agente C# utilizando Microsoft Agent Framework 1.0 y Ollama, implementado en Azure Container Apps. Destaca la API drásticamente más simple del nuevo framework en comparación con Semantic Kernel, facilitando el desarrollo de agentes.

LLMs Microsoft Agent Framework Ollama C++

DOCDEV.to AI·4/5/2026

How to Use MCP Servers With Ollama and Local LLMs

Esta guía explica cómo utilizar servidores MCP con modelos LLM locales a través de Ollama, que no implementa el protocolo MCP de forma nativa. Se necesita configurar un puente que se comunique entre la API de Ollama y el protocolo MCP para gestionar las llamadas a herramientas.

AI integration MCP Protocol LLMs Ollama

DOCfreeCodeCamp (YouTube)·7/5/2026

Open Models Coding Essentials – Running LLMs Locally and in the Cloud Course

Este curso abarca los fundamentos de la codificación para ejecutar Modelos de Lenguaje Grandes (LLMs) tanto de forma local como en la nube. Está diseñado para enseñar cómo implementar y gestionar LLMs en diversos entornos.

LLMs cloud computing learning open models

Open Models Coding Essentials – Running LLMs Locally and in the Cloud Course

ARTICLEDEV.to AI·hace 25d

The Livingrimoire advantage: a tiny “welcome back” skill that LLMs can’t match

El artículo presenta la habilidad "DiOkaeri" de Livingrimoire, mostrando cómo proporciona respuestas conductuales específicas y dependientes del tiempo que los modelos de lenguaje grandes (LLM) no pueden replicar de forma fiable. Destaca que el desarrollo de agentes de IA robustos requiere una arquitectura dedicada para la generación de comportamiento, yendo más allá de las capacidades solo de texto de los LLM.

AI architecture LLMs Livingrimoire behavioral AI

ARTICLEDEV.to AI·hace 26d

The primary reader changed

El artículo explora cómo los agentes de IA leen el código de una manera fundamentalmente diferente a los humanos, lo que resulta en un aumento de 7.5 veces en el costo de los tokens. Este cambio en el "lector primario" introduce una nueva dinámica de costos y requiere una reevaluación de los patrones de programación existentes.

LLMs Software development AI Programming

ARTICLEDEV.to AI·hace 28d

Stop feeding raw HTML to your LLMs (Solving the Agentic Token Tax)

Los agentes de IA autónomos que interactúan con la web se ven afectados por un 'Impuesto de Token Agéntico' debido a la alimentación ineficiente de HTML sin procesar a los LLMs, lo que genera altos costos de API y latencia. Este enfoque a menudo falla con aplicaciones web modernas; por lo tanto, se propone un protocolo determinista como Web Speed como una solución más robusta que los raspadores mejorados.

LLMs Web Interaction token optimization web-scraping

DOCDEV.to AI·28/4/2026

Chinese AI APIs Are 80% Cheaper Than OpenAI — I Tested Them All and Built an Integration Guide

El autor probó APIs de IA chinas como GLM-5.1, Qwen y DeepSeek, encontrándolas un 80% más baratas que las de OpenAI con calidad comparable y fuerte soporte multilingüe. Ofrece una guía de integración completa con código, comparaciones de precios e instrucciones de configuración para facilitar la migración.

Chinese AI models integration LLMs AI APIs

ARTICLEDEV.to AI·hace 26d

Giving AI agents knowledge they were never trained on

La herramienta docs-mcpserver permite a los agentes de IA acceder a conocimientos específicos, como especificaciones internas o versiones particulares de bibliotecas, leyendo varios formatos de documentación como Markdown, referencias de API y esquemas. Esto ayuda a los LLMs a codificar con precisión sin adivinar APIs o desperdiciar tokens en un análisis exhaustivo.

LLMs Software development documentation knowledge base