hallucinations

16 items

ARTICLE↑ trendingHacker News (AI)·hace 8h

Trump's new AI order – hallucinations aren't just for LLMs

El artículo analiza la nueva orden ejecutiva de Trump sobre IA, trazando un paralelo entre las "alucinaciones" de los grandes modelos de lenguaje (LLM) y ciertas declaraciones políticas. Explora las implicaciones de la política gubernamental en la IA y la percepción pública de la verdad en la era digital. La publicación cuestiona la coherencia y la veracidad de la información que emana de diferentes fuentes, ya sean tecnológicas o políticas.

regulation AI policy hallucinations politics

RESEARCHarXiv CS.CL·hace 20h

Evaluating Hallucinations in Domain-Adapted Large Language Models

Este estudio investiga las alucinaciones en Grandes Modelos de Lenguaje adaptados a dominios, centrándose en Llama-2 ajustado con el conjunto de datos Lamini. Se encontró que su capacidad para razonar y recordar nueva información específica del dominio es limitada, lo que lleva a instancias de alucinación y una tendencia a la sobregeneración.

Llama-2 hallucinations Domain Adaptation large language models

ARTICLE↑ trendingHacker News (AI)·hace 14d

OpenAI admits AI hallucinations are mathematically inevitable (Sept. 2025)

OpenAI ha admitido que las alucinaciones de la IA no son meras fallas de ingeniería, sino que son matemáticamente inevitables, una limitación fundamental de los modelos de IA actuales. Esta revelación desafía la percepción de que estos problemas pueden eliminarse por completo con un mayor desarrollo.

limitations hallucinations mathematics AI

ARTICLE↑ trendingReddit r/MachineLearning·6/5/2026

Stop letting LLMs edit your .bib [D]

El autor se muestra impactado por la frecuencia de citas alucinadas por LLMs en trabajos académicos, lo que resulta en listas de autores incorrectas. Cuestiona la falta de respeto por la investigación y la necesidad de sanciones más severas, preguntando si otros experimentan el mismo problema.

LLMs citations hallucinations AI ethics

RESEARCHarXiv CS.CL·7/5/2026

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

Este estudio investiga las alucinaciones de los Grandes Modelos de Lenguaje (ChatGPT, Grok, Gemini, Copilot) en la escritura académica, utilizando 80 indicaciones en cuatro categorías. Se introdujo una nueva métrica ponderada, el Índice de Alucinación (HI), para medir la precisión factual y la validez de las referencias.

academic writing AI quality Model Evaluation hallucinations

RESEARCHarXiv CS.CL·hace 19d

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Esta investigación examina cómo varios niveles de cuantificación de bits bajos afectan el rendimiento de LLaMA-3.1 en el análisis cualitativo, señalando que los modelos de bajo bit a menudo producen alucinaciones. Propone un método de verificación de prompt multipaso consciente de la cuantificación para mejorar la precisión reduciendo sistemáticamente las alucinaciones y filtrando contenido poco fiable.

model performance Qualitative Analysis LLMs hallucinations

RESEARCHarXiv CS.CL·20/4/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Los grandes modelos de lenguaje a menudo alucinan hechos, un problema exacerbado por el ajuste fino supervisado (SFT) que degrada el conocimiento preentrenado. Esta investigación propone un método SFT basado en autodestilación, inspirado en el aprendizaje continuo, para mitigar las alucinaciones regulando la deriva de la distribución de salida, mientras adquiere efectivamente nueva información fáctica.

hallucinations large language models Fine-tuning Continual Learning

ARTICLEDEV.to AI·hace 24d

Your AI Agent Hallucinates Tailwind Classes. Here's the Fix

Los agentes de IA a menudo generan clases de Tailwind CSS inexistentes porque carecen del contexto de configuración específico del proyecto, lo que lleva a "alucinaciones". Se introduce la herramienta `tailwind-context-resolver-mcp` como solución para proporcionar a los agentes conocimiento del sistema de diseño resuelto del proyecto.

Tailwind CSS code generation hallucinations AI development

DOCDEV.to AI·6/5/2026

The "Logic Span": Using OpenTelemetry to Trace Hallucinations

Este contenido presenta el método "Logic Span", que utiliza OpenTelemetry para rastrear y depurar alucinaciones en Grandes Modelos de Lenguaje (LLMs). Al envolver cada "Pensamiento" o "Paso de Razonamiento" en un Span OTel dedicado, los desarrolladores pueden identificar dónde la lógica de un LLM se desvía de su plan previsto, tratando las alucinaciones como un rastreo de pila.

hallucinations observability Debugging OpenTelemetry

ARTICLEDEV.to AI·hace 29d

Prompt AI Coding Assistants to Build Production-Ready Agents: 8 Essential Patterns

Este artículo aborda la importancia de utilizar patrones esenciales al solicitar a los asistentes de codificación de IA que construyan agentes listos para producción. Al especificar decisiones de arquitectura, se pueden evitar fallos como alucinaciones y el desperdicio de tokens, que a menudo ocurren silenciosamente hasta la producción.

prompt engineering code generation hallucinations AI development

RESEARCHarXiv CS.LG·28/4/2026

KARL: Mitigating Hallucinations in LLMs via Knowledge-Boundary-Aware Reinforcement Learning

KARL es un nuevo framework diseñado para mitigar alucinaciones en grandes modelos de lenguaje, permitiéndoles abstenerse apropiadamente de preguntas más allá de su conocimiento. Esto se logra mediante una Recompensa Sensible a los Límites del Conocimiento que estima dinámicamente el conocimiento del modelo y una Estrategia de Entrenamiento RL en Dos Etapas que previene la cautela excesiva.

reinforcement learning hallucinations AI safety LLM

RESEARCHarXiv CS.CL·hace 20d

Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering

Este artículo sostiene que los métodos actuales de Cuantificación de Incertidumbre (UQ) para LLMs son, en realidad, algoritmos de agrupamiento no supervisado, que miden la consistencia interna de las generaciones del modelo en lugar de su corrección externa. En consecuencia, estos métodos no detectan las "alucinaciones confiadas" y pueden generar una falsa sensación de seguridad al desplegar LLMs en ámbitos de alto riesgo.

LLMs Uncertainty Quantification hallucinations AI safety

ARTICLEDEV.to AI·2/5/2026

RAG Series (1): Why LLMs Need External Memory

Este contenido explica que las alucinaciones y la limitación de conocimiento de los LLMs se deben a que su memoria se congela en el momento del entrenamiento. Esto les impide acceder a datos nuevos o internos, lo que los lleva a inventar respuestas o admitir ignorancia.

LLMs AI limitations RAG hallucinations

ARTICLEDEV.to AI·hace 24d

Day 27: What GPT-4 Hallucinating 'Amritavati' Taught Me About Building Health AI for India

La experiencia con GPT-4 alucinando un fármaco ficticio, "Amritavati", subraya los peligros de simplemente traducir la IA para la atención médica en la India. El proyecto GoDavaii busca desarrollar una IA de salud que comprenda los matices culturales y lingüísticos de la India, verificando los remedios caseros y adaptándose a diversas expresiones de síntomas.

India Healthcare language hallucinations

ARTICLEDEV.to AI·10/4/2026

Citation Needed: Structured data extraction workflows

Este artigo explora a construção de um fluxo de trabalho utilizando modelos de linguagem generativos para verificar se um texto fornece evidências para suas afirmações, útil para auto-crítica ou detecção de alucinações. A tarefa exige um grau de compreensão de leitura e rigor que apenas modelos de linguagem maiores e de fronteira podem abordar, superando as capacidades de pipelines de PNL tradicionais.

structured data LLMs Workflow hallucinations

ARTICLEDeepLearning.AI (YouTube)·hace 27d

Why AI keeps lying to you

El artículo explora por qué los modelos de IA, especialmente los grandes modelos de lenguaje, producen con frecuencia información inexacta o fabricada. Explica que este fenómeno, a menudo llamado "alucinación" o "mentira", se deriva de su naturaleza probabilística y de los datos de entrenamiento, en lugar de un engaño deliberado.

AI accuracy AI limitations hallucinations