← heapsort-ai

hallucinations

16 items

ARTICLE↑ trendingHacker News (AI)·hace 8h

Trump's new AI order – hallucinations aren't just for LLMs

El artículo analiza la nueva orden ejecutiva de Trump sobre IA, trazando un paralelo entre las "alucinaciones" de los grandes modelos de lenguaje (LLM) y ciertas declaraciones políticas. Explora las implicaciones de la política gubernamental en la IA y la percepción pública de la verdad en la era digital. La publicación cuestiona la coherencia y la veracidad de la información que emana de diferentes fuentes, ya sean tecnológicas o políticas.

76
RESEARCHarXiv CS.CL·hace 20h

Evaluating Hallucinations in Domain-Adapted Large Language Models

Este estudio investiga las alucinaciones en Grandes Modelos de Lenguaje adaptados a dominios, centrándose en Llama-2 ajustado con el conjunto de datos Lamini. Se encontró que su capacidad para razonar y recordar nueva información específica del dominio es limitada, lo que lleva a instancias de alucinación y una tendencia a la sobregeneración.

55
ARTICLE↑ trendingReddit r/MachineLearning·6/5/2026

Stop letting LLMs edit your .bib [D]

El autor se muestra impactado por la frecuencia de citas alucinadas por LLMs en trabajos académicos, lo que resulta en listas de autores incorrectas. Cuestiona la falta de respeto por la investigación y la necesidad de sanciones más severas, preguntando si otros experimentan el mismo problema.

42
RESEARCHarXiv CS.CL·7/5/2026

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

Este estudio investiga las alucinaciones de los Grandes Modelos de Lenguaje (ChatGPT, Grok, Gemini, Copilot) en la escritura académica, utilizando 80 indicaciones en cuatro categorías. Se introdujo una nueva métrica ponderada, el Índice de Alucinación (HI), para medir la precisión factual y la validez de las referencias.

28
RESEARCHarXiv CS.CL·hace 19d

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Esta investigación examina cómo varios niveles de cuantificación de bits bajos afectan el rendimiento de LLaMA-3.1 en el análisis cualitativo, señalando que los modelos de bajo bit a menudo producen alucinaciones. Propone un método de verificación de prompt multipaso consciente de la cuantificación para mejorar la precisión reduciendo sistemáticamente las alucinaciones y filtrando contenido poco fiable.

28
RESEARCHarXiv CS.CL·20/4/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Los grandes modelos de lenguaje a menudo alucinan hechos, un problema exacerbado por el ajuste fino supervisado (SFT) que degrada el conocimiento preentrenado. Esta investigación propone un método SFT basado en autodestilación, inspirado en el aprendizaje continuo, para mitigar las alucinaciones regulando la deriva de la distribución de salida, mientras adquiere efectivamente nueva información fáctica.

27
DOCDEV.to AI·6/5/2026

The "Logic Span": Using OpenTelemetry to Trace Hallucinations

Este contenido presenta el método "Logic Span", que utiliza OpenTelemetry para rastrear y depurar alucinaciones en Grandes Modelos de Lenguaje (LLMs). Al envolver cada "Pensamiento" o "Paso de Razonamiento" en un Span OTel dedicado, los desarrolladores pueden identificar dónde la lógica de un LLM se desvía de su plan previsto, tratando las alucinaciones como un rastreo de pila.

27
ARTICLEDEV.to AI·hace 29d

Prompt AI Coding Assistants to Build Production-Ready Agents: 8 Essential Patterns

Este artículo aborda la importancia de utilizar patrones esenciales al solicitar a los asistentes de codificación de IA que construyan agentes listos para producción. Al especificar decisiones de arquitectura, se pueden evitar fallos como alucinaciones y el desperdicio de tokens, que a menudo ocurren silenciosamente hasta la producción.

27
RESEARCHarXiv CS.LG·28/4/2026

KARL: Mitigating Hallucinations in LLMs via Knowledge-Boundary-Aware Reinforcement Learning

KARL es un nuevo framework diseñado para mitigar alucinaciones en grandes modelos de lenguaje, permitiéndoles abstenerse apropiadamente de preguntas más allá de su conocimiento. Esto se logra mediante una Recompensa Sensible a los Límites del Conocimiento que estima dinámicamente el conocimiento del modelo y una Estrategia de Entrenamiento RL en Dos Etapas que previene la cautela excesiva.

27
RESEARCHarXiv CS.CL·hace 20d

Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering

Este artículo sostiene que los métodos actuales de Cuantificación de Incertidumbre (UQ) para LLMs son, en realidad, algoritmos de agrupamiento no supervisado, que miden la consistencia interna de las generaciones del modelo en lugar de su corrección externa. En consecuencia, estos métodos no detectan las "alucinaciones confiadas" y pueden generar una falsa sensación de seguridad al desplegar LLMs en ámbitos de alto riesgo.

27
ARTICLEDEV.to AI·hace 24d

Day 27: What GPT-4 Hallucinating 'Amritavati' Taught Me About Building Health AI for India

La experiencia con GPT-4 alucinando un fármaco ficticio, "Amritavati", subraya los peligros de simplemente traducir la IA para la atención médica en la India. El proyecto GoDavaii busca desarrollar una IA de salud que comprenda los matices culturales y lingüísticos de la India, verificando los remedios caseros y adaptándose a diversas expresiones de síntomas.

27
ARTICLEDEV.to AI·10/4/2026

Citation Needed: Structured data extraction workflows

Este artigo explora a construção de um fluxo de trabalho utilizando modelos de linguagem generativos para verificar se um texto fornece evidências para suas afirmações, útil para auto-crítica ou detecção de alucinações. A tarefa exige um grau de compreensão de leitura e rigor que apenas modelos de linguagem maiores e de fronteira podem abordar, superando as capacidades de pipelines de PNL tradicionais.

27
ARTICLEDeepLearning.AI (YouTube)·hace 27d

Why AI keeps lying to you

El artículo explora por qué los modelos de IA, especialmente los grandes modelos de lenguaje, producen con frecuencia información inexacta o fabricada. Explica que este fenómeno, a menudo llamado "alucinación" o "mentira", se deriva de su naturaleza probabilística y de los datos de entrenamiento, en lugar de un engaño deliberado.

Why AI keeps lying to you
22