hallucination

28 items

RESEARCHarXiv CS.LG·hace 29d

Breaking the Illusion: When Positive Meets Negative in Multimodal Decoding

Se presenta un nuevo framework de inferencia sin entrenamiento, Decodificación Positiva y Negativa (PND), para abordar la alucinación de objetos en Modelos de Visión-Lenguaje (VLMs). PND refuerza la fidelidad visual mediante un mecanismo de contraste de doble vía, logrando un rendimiento de vanguardia sin necesidad de reentrenamiento.

multimodal AI hallucination Vision-Language Models decoding

RESEARCHarXiv CS.CL·hace 15d

Graph Alignment Topology as an Inductive Bias for Grounding Detection

Los Modelos de Lenguaje Grandes (LLM) están optimizados para producir continuaciones plausibles en lugar de verificar explícitamente si las proposiciones generadas se derivan de documentos fuente, lo que limita su uso en dominios críticos. Esta investigación propone aprovechar la topología de alineación como un sesgo inductivo, construyendo grafos bipartitos alineados entre la información de referencia y las salidas del LLM, y entrenando una Red Neuronal Gráfica (GNN).

LLMs hallucination grounding detection GNNs

ARTICLEDEV.to AI·24/4/2026

I Built a Multi-LLM Debate Engine That Fact-Checks Itself in Real Time

El artículo describe la construcción de un motor de debate multi-LLM que se auto-verifica en tiempo real para combatir la tendencia de los LLM a la adulación y la alucinación. Propone un debate estructurado entre agentes con roles distintos, incluyendo un agente dedicado a la verificación de hechos a mitad del debate.

AI models LLMs hallucination multi-agent systems

ARTICLEKDNuggets·hace 29d

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

Este artículo analiza la implementación de una infraestructura para medir y controlar las respuestas excesivamente detalladas y las "alucinaciones" de los LLM. Se centra en establecer barreras de seguridad para asegurar resultados de IA más controlados y precisos.

hallucination AI quality guardrails LLM

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

RESEARCHarXiv CS.AI·8/4/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

NEWSDEV.to AI·25/4/2026

GPT-5.5 Tops Benchmarks, Costs 2x API Price, Still Hallucinates

OpenAI lanzó GPT-5.5, un modelo agéntico que encabeza los benchmarks en codificación y matemáticas, superando a sus competidores. Sin embargo, pruebas independientes revelan mayores tasas de alucinación y mayores costos efectivos de API.

hallucination Benchmarking Agentic AI AI Model

ARTICLEDEV.to AI·12/4/2026

Your RAG pipeline doesn't tell you when it's wrong. Here's how to fix that.

El texto aborda la falla de los pipelines RAG en indicar cuándo las respuestas del LLM son incorrectas, incluso con alta confianza en la recuperación. Presenta una solución, como la API Wauldo, para comparar las afirmaciones de la respuesta con el texto fuente y verificar su veracidad.

hallucination accuracy RAG AI evaluation

ARTICLEDEV.to AI·14/4/2026

Whisper Hallucination on Silence: Why Your Transcript Loops the Same Phrase

Este contenido explora el fenómeno de la alucinación en el modelo Whisper, explicando por qué las transcripciones pueden repetir la misma frase. Detalla las causas de este comportamiento cuando el modelo procesa períodos de silencio.

hallucination audio processing Whisper Model AI