← heapsort-ai

hallucination

28 items

RESEARCH↑ trendingReddit r/MachineLearning·24/4/2026

New project about llm hallucination [P]

Este contenido introduce un nuevo proyecto secundario y su repositorio de GitHub, centrado en mitigar la alucinación de LLM mediante un novedoso método de muestreo contrastivo y entrenamiento selectivo. La idea central trata la alucinación como un problema de preferencia, utilizando muestras negativas auto-generadas y un aprendizaje basado en divergencia y con compuertas para promover respuestas correctas y suprimir las incorrectas.

New project about llm hallucination [P]
45
RESEARCHarXiv CS.CL·hace 13d

Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations

El estudio investiga por qué los LLM alucinan al razonar sobre conocimiento estructurado linealizado. Revela que las alucinaciones surgen de dinámicas internas sistemáticas, como la atención que se concentra en atajos y las capas feed-forward que no logran fundamentar el conocimiento proporcionado.

29
ARTICLEDEV.to AI·14/4/2026

Opus 4.6 Hallucination Rate Hit 33% — Here's What Changed and How to Fix It

Los desarrolladores han informado de un notable descenso en la calidad de codificación de Claude Opus 4.6, con puntos de referencia independientes confirmando que su tasa de alucinación casi se duplicó al 33%. El artículo cubre la evidencia, la causa raíz y las configuraciones para solucionar el problema de fabricación de información del modelo.

29
RESEARCHarXiv CS.LG·20/4/2026

Hallucination as Trajectory Commitment: Causal Evidence for Asymmetric Attractor Dynamics in Transformer Generation

El estudio proporciona evidencia causal de que la alucinación en modelos de lenguaje autorregresivos es un compromiso temprano de trayectoria regido por dinámicas de atractor asimétricas. La investigación demuestra que las trayectorias fácticas y alucinadas divergen en el primer token, y que corregir una trayectoria alucinada requiere una intervención sostenida, mientras que la corrupción es más sencilla.

27
RESEARCHarXiv CS.CL·7/5/2026

MedFabric and EtHER: A Data-Centric Framework for Word-Level Fabrication Generation and Detection in Medical LLMs

Este artículo presenta MedFabric, una metodología centrada en datos para generar fabricaciones realistas a nivel de palabra en LLMs médicos, abordando las deficiencias en los conjuntos de datos existentes. También introduce ETHER, un detector modular de fabricaciones a nivel de palabra que integra diversas técnicas para mejorar la evaluación fáctica.

27
ARTICLEDEV.to AI·hace 27d

Building a production-ready RAG pipeline

Los Grandes Modelos de Lenguaje (LLMs) a menudo alucinan cuando carecen de contexto actual o conocimiento específico. La Generación Aumentada por Recuperación (RAG) lo corrige proporcionando a los LLMs datos externos y relevantes, permitiéndoles generar respuestas precisas; el autor construyó Keystone para aplicar RAG a la actividad de repositorios de GitHub.

27
ARTICLEDEV.to AI·9/5/2026

Someone Called My AI System a Tool. Then They Showed Me Theirs.

El autor relata un encuentro en una conferencia donde su sofisticado sistema de IA, con puertas anti-fabricación y memoria persistente, fue llamado una "herramienta". Esto se contrasta con el marco de agente más simple de otro asistente, lo que provocó una discusión sobre la crucial falta de salvaguardas contra la alucinación de la IA en este último.

27
RESEARCHarXiv CS.CL·15/4/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artículo propone VLM-DeflectionBench, un nuevo benchmark para Large Vision-Language Models (LVLMs) que aborda la deflexión y la alucinación en escenarios con evidencia conflictiva o insuficiente. También introduce un pipeline de curación de datos dinámico para preservar la dificultad del benchmark y un protocolo de evaluación detallado para analizar el comportamiento del modelo.

27
RESEARCHarXiv CS.CL·9/4/2026

Hallucination as output-boundary misclassification: a composite abstention architecture for language models

Este artigo enquadra a alucinação em grandes modelos de linguagem como um erro de classificação e propõe uma intervenção composta por recusa baseada em instruções e um gate de abstenção estrutural. O gate utiliza um score de déficit de suporte de sinais como auto-consistência e cobertura de citação, mas a avaliação controlada mostrou que nenhum mecanismo isolado foi suficiente para mitigar totalmente o problema.

27