LLMs

723 items

ARTICLEDEV.to AI·18/4/2026

Why Our LLM-Powered Data Analytics Pipeline in R Broke Down at Scale

Este artículo narra el colapso de un pipeline de análisis de datos en R, impulsado por LLMs, que funcionó bien en una prueba de concepto pero falló estrepitosamente a escala. La historia busca advertir y enseñar sobre los desafíos de integrar modelos de lenguaje en flujos de trabajo de datos en R en producción.

scalability LLMs R programming Production issues

ARTICLEDEV.to AI·22/4/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) se presenta como el principal método PEFT, permitiendo la adaptación eficiente de LLM masivos como Llama 3 sin necesidad de muchos recursos de hardware. El artículo promete explorar la intuición matemática de LoRA, el concepto de "dimensión intrínseca" y su impacto revolucionario para los ingenieros de IA.

LLMs deep learning fine-tuning PEFT

ARTICLEDEV.to AI·12/4/2026

Serverless Memory DBs for AI Agents in 2025

El contenido aborda la falta de memoria en los agentes de IA como un problema arquitectónico, no de datos, destacando que la comunidad está creando soluciones. Propone bases de datos de memoria serverless para desacoplar el almacenamiento de la inferencia, permitiendo que los LLM se centren en el razonamiento y criticando la ineficacia de insertar contexto en los prompts.

LLMs memory Architecture serverless databases

ARTICLEDEV.to AI·9/5/2026

Future of AI Agents in Agentic AI

La IA Agentiva se refiere a sistemas de inteligencia artificial que pueden actuar de forma autónoma, tomar decisiones y realizar tareas sin la intervención humana constante. Impulsados por grandes modelos de lenguaje y marcos de uso de herramientas sofisticados, estos agentes de IA son considerados la próxima gran novedad en el campo.

future of AI LLMs Agentic AI AI agents

ARTICLEDEV.to AI·21/4/2026

Amazon Is Betting $25 Billion More on Anthropic. Here's What That Really Means.

Amazon confirmó una inversión de hasta 25 mil millones de dólares en Anthropic, sumándose a los 8 mil millones ya aportados, para una asociación ampliada centrada en infraestructura de IA, con Anthropic comprometiéndose a usar las tecnologías de AWS por una década. Este acuerdo revela la dirección de la IA, la carrera por la infraestructura y el ascenso comercial de Anthropic.

LLMs cloud computing AWS AI partnership

ARTICLEML Mastery·hace 7d

Scikit-LLM vs. Traditional Text Classifiers: When Should You Use an LLM?

El contenido analiza cómo los modelos de IA generativa, como los LLM, han superado gradualmente a los métodos de aprendizaje automático tradicionales para tareas como la clasificación de texto. Explora cuándo es adecuado utilizar un LLM para estas tareas.

LLMs machine learning text classification Scikit-LLM

Scikit-LLM vs. Traditional Text Classifiers: When Should You Use an LLM?

ARTICLEDEV.to AI·21/4/2026

Harness Engineering: The Most Important Part of AI Agents

El artículo sostiene que los agentes de IA no surgen de LLMs más inteligentes, sino de integrarlos en un sistema robusto mediante la "ingeniería de arnés". Este enfoque subraya los desafíos prácticos de construir aplicaciones de IA fiables y del mundo real, más allá del rendimiento del modelo.

System Design LLMs reliability software engineering

ARTICLEDEV.to AI·15/4/2026

AI Tech Daily Agent — Complete Architecture Deep Dive & Workflow Analysis

Este contenido analiza en profundidad la arquitectura y el flujo de trabajo de un agente de IA autónomo para el periodismo tecnológico diario, construido con el framework Fetch.ai uAgents. Describe cómo el sistema automatiza la investigación, el análisis y la generación de artículos complejos sobre tecnología y IA.

LLMs workflow automation Autonomous systems Architecture

RESEARCHarXiv CS.AI·20/4/2026

LACE: Lattice Attention for Cross-thread Exploration

LACE es un nuevo marco que permite a los Grandes Modelos de Lenguaje (LLMs) coordinar y compartir conocimientos entre múltiples rutas de razonamiento paralelas mediante atención entre hilos. Utiliza un pipeline de datos sintéticos para enseñar la corrección de errores colaborativa, mejorando la precisión del razonamiento en más de 7 puntos.

synthetic data LLMs Attention Mechanisms AI Reasoning

RESEARCHarXiv CS.LG·20/4/2026

The Illusion of Equivalence: Systematic FP16 Divergence in KV-Cached Autoregressive Inference

Esta investigación revela que el caché KV en la inferencia autorregresiva de transformadores, bajo precisión FP16 estándar, provoca una divergencia sistemática en las secuencias de tokens decodificadas debido a diferentes órdenes de acumulación de punto flotante. Se observó una tasa de divergencia del 100% en modelos como LLaMA-2-7B y Mistral-7B, con el caché-ON a menudo resultando en mayor precisión.

AI models inference LLMs numerical precision

RESEARCHarXiv CS.LG·20/4/2026

Sequential KV Cache Compression via Probabilistic Language Tries: Beyond the Per-Vector Shannon Limit

Esta investigación introduce la compresión secuencial de KV, una novedosa arquitectura de dos capas para caches de clave-valor de transformadores que supera el límite de Shannon por vector. Aprovecha la naturaleza secuencial de los tokens del cache KV, utilizando la deduplicación probabilística de prefijos y la codificación delta predictiva para una compresión más eficiente.

Transformer Architecture AI models LLMs data compression

RESEARCHarXiv CS.AI·15/4/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Esta investigación presenta GoodPoint, un método que utiliza LLMs y respuestas de autores para generar retroalimentación constructiva para artículos científicos. Desarrolla GoodPoint-ICLR, un conjunto de datos de artículos ICLR, y una receta de entrenamiento que emplea fine-tuning y optimización de preferencias para una retroalimentación válida y accionable.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.AI·16/4/2026

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Este trabajo presenta SciFi, un marco agéntico seguro, ligero y fácil de usar para la ejecución autónoma de tareas científicas. Combina un entorno aislado, un bucle de agente de tres capas y un mecanismo de auto-evaluación para asegurar una operación fiable, aprovechando los LLMs para automatizar cargas de trabajo científicas rutinarias y liberar a los investigadores para actividades creativas.

LLMs Workflow Agentic AI automation

RESEARCHarXiv CS.AI·17/4/2026

GFT: From Imitation to Reward Fine-Tuning with Unbiased Group Advantages and Dynamic Coefficient Rectification

Este trabajo presenta el Group Fine-Tuning (GFT), un marco unificado de post-entrenamiento para grandes modelos de lenguaje. Aborda las limitaciones intrínsecas del ajuste fino supervisado (SFT), como la dependencia de una sola ruta y el colapso de la entropía, mediante el aprendizaje de ventajas de grupo y la rectificación dinámica de coeficientes.

LLMs reinforcement learning post-training machine learning

ARTICLEDEV.to AI·6/5/2026

Released my first open source project — MIT-licensed CLI for AI-assisted commit messages

El autor ha lanzado su primer proyecto de código abierto, una herramienta CLI con licencia MIT para mensajes de commit asistidos por IA. El proyecto ofrece soporte para modelos locales mediante la integración de Ollama, y el autor se compromete con el mantenimiento, abierto a co-mantenedores si el interés crece.

open-source LLMs development AI tools

RESEARCHarXiv CS.CL·22/4/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Este artículo examina el papel de la transliteración en PNL, una técnica clave para superar la "barrera de escritura" en la transferencia interlingüística. El estudio presenta una taxonomía de motivaciones y enfoques, analizando su evolución y necesidad en los LLM modernos en varios contextos beneficiosos.

Cross-lingual AI language models LLMs NLP

RESEARCHarXiv CS.CL·22/4/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Este trabajo investiga la injusticia contrafactual en LLMs, observando cómo sus respuestas al humor cambian al intercambiar las identidades del hablante y del oyente. Los experimentos revelan disparidades relacionales consistentes, donde los chistes contados por hablantes privilegiados son rechazados o juzgados como maliciosos con mayor frecuencia.

ethics social impact LLMs Bias

RESEARCHarXiv CS.AI·22/4/2026

ARES: Adaptive Red-Teaming and End-to-End Repair of Policy-Reward System

ARES presenta un marco para abordar las debilidades sistémicas en LLMs alineados con RLHF, donde los Modelos de Recompensa imperfectos no logran penalizar comportamientos inseguros. Utiliza un "Safety Mentor" para red-teaming adaptativo, descubriendo y mitigando estas vulnerabilidades duales tanto en el LLM como en su Modelo de Recompensa.

LLMs reinforcement learning security

ARTICLEDEV.to AI·22/4/2026

RAG: How AI Models Use Your Data Without Forgetting

Los grandes modelos de lenguaje son inherentemente sin estado, carecen de memoria de conversaciones anteriores o acceso a datos actualizados o privados. RAG (Retrieval Augmented Generation) aborda esto introduciendo un paso de recuperación, permitiendo que los modelos accedan a información externa y funcionen como un motor de razonamiento sobre esos datos.

LLMs RAG AI Information Retrieval

ARTICLEDEV.to AI·hace 27d

The Death of RAG? Long-Context Windows vs. Vector Databases

El artículo explora si la Generación Aumentada por Recuperación (RAG) está quedando obsoleta debido a las grandes ventanas de contexto de los nuevos LLMs. Se argumenta que RAG sigue siendo relevante por su rentabilidad, menor latencia y eficiencia en el manejo de datos propietarios que cambian con frecuencia.

AI architecture LLMs Vector Databases RAG