LLMs

715 items

ARTICLE↑ trendingReddit r/LocalLLaMA·30/4/2026

Open Models - April 2026 - One of the best months of all time for Local LLMs?

El contenido analiza modelos abiertos, particularmente LLMs Locales, de abril de 2026, destacándolo como un mes potencialmente excelente para ellos. También señala un cambio de licencia para MiniMax-M2.7 y pide sugerencias de modelos subestimados.

Open Source AI models LLMs licensing

Open Models - April 2026 - One of the best months of all time for Local LLMs?

RESEARCHarXiv CS.CL·hace 1d

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

La Hipótesis Piggyback explica cómo los tokens de plantilla de chat pueden causar desalineación emergente en LLMs, generalizando el comportamiento ajustado a consultas fuera del dominio. Se propone la técnica Token-Regularized Finetuning (TReFT) para mitigar este problema, preservando el aprendizaje en el dominio y reduciendo la desalineación.

Finetuning Emergent Misalignment LLMs Generalization

ARTICLEDEV.to AI·23/4/2026

Retrieval-Augmented Generation: State of the Art and Future Directions

La Generación Aumentada por Recuperación (RAG) sigue siendo crucial para superar las limitaciones de los Grandes Modelos de Lenguaje (LLMs), como las alucinaciones y el conocimiento obsoleto, al integrar sistemas de recuperación externos. El texto describe la evolución de RAG desde un diseño lineal simple hasta una arquitectura en capas más robusta en sistemas de producción.

AI architecture LLMs RAG

ARTICLE↑ trendingReddit r/LocalLLaMA·21/4/2026

Kimi K2.6 is a legit Opus 4.7 replacement

Kimi K2.6 es recomendado como un reemplazo viable para Opus 4.7, capaz de realizar el 85% de las tareas con buena calidad, con visión y excelente uso del navegador, siendo efectivo para tareas a largo plazo. El autor sugiere que esto demuestra que los LLM de frontera no siempre ofrecen innovaciones, y las soluciones locales podrían ser preferibles debido a los límites de uso.

AI models LLMs Benchmarks Local AI

NEWS↑ trendingReddit r/LocalLLaMA·9/4/2026

backend-agnostic tensor parallelism has been merged into llama.cpp

A funcionalidade de paralelismo de tensor backend-agnóstico foi integrada ao llama.cpp, permitindo que modelos de IA rodem muito mais rápido em sistemas com múltiplas GPUs. Isso significa que a aceleração de desempenho não exige mais CUDA.

LLMs Otimização GPU IA

NEWS↑ trendingReddit r/LocalLLaMA·21/4/2026

Open WebUI Desktop Released!

Se ha lanzado la versión de escritorio de Open WebUI, que ahora incluye llama.cpp. Permite ejecutar modelos de IA de forma local o conectarse a un servidor remoto.

LLMs User Interface Local AI AI

DOC↑ trendingReddit r/LocalLLaMA·4/5/2026

it's time to update your Gemma 4 GGUFs

Es hora de actualizar tus modelos Gemma 4 GGUF, ya que la plantilla de chat fue corregida hace unos días. Se proporcionan varios enlaces para descargar los modelos actualizados.

AI models LLMs update Gemma

DOC↑ trendingReddit r/LocalLLaMA·26/4/2026

What is the best coding agent (CLI) like Claude Code for Local Development

El usuario busca ayuda para configurar el agente Claude Code para desarrollo local, específicamente con llama.cpp y el modelo Qwen3.6-35B-A3B, ya que está teniendo dificultades. Pide orientación, guías o sugerencias de herramientas alternativas como pi.dev.

LLMs Coding Agent development AI tools

RESEARCHarXiv CS.AI·hace 1d

CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions

Este artículo presenta CrowdMath, un conjunto de datos de 164 cadenas de progreso anotadas por expertos del programa CrowdMath del MIT PRIMES--Art of Problem Solving. Su objetivo es evaluar los grandes modelos de lenguaje en la resolución colaborativa de problemas matemáticos abiertos, difiriendo de los puntos de referencia centrados en respuestas finales o pruebas completas.

mathematical reasoning LLMs datasets Benchmarks

DOCML Mastery·hace 18d

Building Context-Aware Search in Python with LLM Embeddings + Metadata

Este contenido trata sobre la construcción de un sistema de búsqueda consciente del contexto en Python, utilizando incrustaciones de LLM y metadatos. Explora cómo superar las limitaciones de la búsqueda por palabras clave, que falla si un término no está literalmente presente en el documento.

LLMs development search embeddings

Building Context-Aware Search in Python with LLM Embeddings + Metadata

ARTICLE↑ trendingReddit r/LocalLLaMA·3/5/2026

One bash permission slipped...

Un usuario relata un incidente en el que un modelo de lenguaje (LLM) generó comandos bash incorrectos, incluido un "rm -rf", lo que provocó una interrupción masiva de datos. A pesar de la pérdida, el usuario se alegró de hacer push con frecuencia y señaló que el incidente ocurrió en una VM aislada.

LLMs bash security data disruption

RESEARCHarXiv CS.LG·14/4/2026

Human-like Working Memory Interference in Large Language Models

Este estudio examina las limitaciones de la memoria de trabajo en los Large Language Models (LLMs), revelando patrones de interferencia similares a los humanos. Los LLMs preentrenados muestran una degradación del rendimiento con la carga de memoria y un sesgo por recencia, a pesar de que los transformadores pueden ser entrenados para resolver estas tareas perfectamente.

LLMs AI limitations Working Memory human cognition

RESEARCHarXiv CS.CL·hace 18d

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Este artículo presenta PromptNCE, un método para estimar la información mutua puntual (PMI) utilizando solo LLMs y prompts de estimación contrastiva, evitando la necesidad de críticos específicos de la tarea. Introduce un benchmark con PMI derivado de humanos y demuestra que PromptNCE logra una correlación de Spearman de hasta 0,82.

information theory LLMs prompt-engineering machine learning

RESEARCHarXiv CS.CL·20/4/2026

Consistency Analysis of Sentiment Predictions using Syntactic & Semantic Context Assessment Summarization (SSAS)

Este artículo presenta el marco Syntactic & Semantic Context Assessment Summarization (SSAS) para abordar la inconsistencia de las predicciones de sentimiento de los LLM, un desafío para el análisis empresarial fiable. SSAS actúa como un preprocesador de datos sofisticado, utilizando clasificación jerárquica y resumen iterativo para crear un contexto de alta señal y densidad de sentimiento, lo que hace que las predicciones sean más estables para decisiones estratégicas de negocio.

LLMs sentiment analysis data preprocessing Enterprise AI

ARTICLE↑ trendingReddit r/LocalLLaMA·18/4/2026

Are you guys actually using local tool calling or is it a collective prank?

Un usuario expresa su frustración con la funcionalidad de llamada de herramientas locales de LLMs como Qwen y Gemma, encontrando alucinaciones y bucles de ejecución al intentar crear archivos. Cuestiona si la dificultad es una limitación de los modelos pequeños o un error de configuración con Open WebUI y LM Studio.

LLMs hallucination AI limitations open-source AI

RESEARCHarXiv CS.AI·16/4/2026

Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models

Este artículo analiza rigurosamente cómo la inestabilidad numérica de la precisión finita genera imprevisibilidad en los LLM, un problema crítico de fiabilidad en los flujos de trabajo agénticos. Detalla la propagación de errores de redondeo, identificando un "efecto avalancha" caótico en las capas tempranas y comportamientos caóticos universales dependientes de la escala.

Transformer Architecture LLMs chaos theory AI reliability

ARTICLEDeepLearning.AI (YouTube)·hace 19d

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

Este contenido aborda la cuestión crítica de si los Grandes Modelos de Lenguaje (LLMs) son capaces de producir código con la calidad requerida para entornos empresariales. Tom Howlett explora los desafíos y las capacidades de estas tecnologías en el desarrollo de software de nivel empresarial.

LLMs software development code generation AI development

AI Dev 26 x SF | Tom Howlett: Can LLMs Generate Enterprise Quality Code?

ARTICLEDEV.to AI·25/4/2026

Calculator Never Guesses. But LLM Always Does.

El contenido contrasta los LLM como predictores probabilísticos que "adivinan" respuestas aritméticas basándose en patrones de datos, con las calculadoras como motores deterministas que realizan operaciones exactas. Esta distinción fundamental explica las dificultades de los LLM con la aritmética y sugiere un futuro híbrido para la IA.

LLMs algorithmic reasoning AI limitations hybrid AI

DOCHugging Face Blog·hace 2d

Her · हेर — a detective for your Claude Code sessions

Her · हेर es una herramienta diseñada para asistir en las sesiones de codificación de Claude, actuando como un 'detective' para analizar el código y la interacción.

LLMs Claude AI tools Debugging

DOCDEV.to AI·hace 4d

What Is Ollama? The Complete Guide to Running LLMs Locally in 2026

Este contenido ofrece una guía completa sobre Ollama, explicando cómo permite ejecutar Large Language Models (LLMs) localmente, manteniendo los datos en su máquina, trabajando sin conexión y eliminando los costos por token. Detalla las funcionalidades de Ollama, como la gestión de modelos y la capacidad de construir chatbots privados, asistentes de codificación y sistemas RAG.

LLMs Ollama Local AI AI development