hallucination

28 items

RESEARCHarXiv CS.LG·il y a 29j

Breaking the Illusion: When Positive Meets Negative in Multimodal Decoding

Un nouveau cadre d'inférence sans entraînement, la Décodification Positive et Négative (PND), est introduit pour lutter contre l'hallucination d'objets dans les Modèles Vision-Langage (VLM). Le PND assure la fidélité visuelle via un mécanisme de contraste à double chemin, offrant des performances de pointe sans réentraînement.

multimodal AI hallucination Vision-Language Models decoding

RESEARCHarXiv CS.CL·il y a 15j

Graph Alignment Topology as an Inductive Bias for Grounding Detection

Les grands modèles linguistiques (LLM) sont optimisés pour des continuations plausibles plutôt que pour vérifier explicitement l'ancrage des propositions aux documents sources, limitant leur usage dans des domaines critiques. Cette recherche propose d'exploiter la topologie d'alignement comme biais inductif en construisant des graphes bipartites alignés entre les informations de référence et les sorties de LLM, puis en entraînant un réseau neuronal graphique (GNN).

LLMs hallucination grounding detection GNNs

ARTICLEDEV.to AI·24/04/2026

I Built a Multi-LLM Debate Engine That Fact-Checks Itself in Real Time

L'article décrit la création d'un moteur de débat multi-LLM qui se vérifie lui-même en temps réel pour combattre la tendance des LLM à la flagornerie et à l'hallucination. Il propose un débat structuré entre agents aux rôles distincts, incluant un agent de vérification des faits dédié en plein débat.

AI models LLMs hallucination multi-agent systems

ARTICLEKDNuggets·il y a 29j

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

Cet article traite de la mise en œuvre d'une infrastructure pour mesurer et contrôler les réponses excessivement verbeuses et les « hallucinations » des LLM. Il vise à garantir des sorties d'IA plus contrôlées et précises grâce à des garde-fous.

hallucination AI quality guardrails LLM

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

RESEARCHarXiv CS.AI·08/04/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

NEWSDEV.to AI·25/04/2026

GPT-5.5 Tops Benchmarks, Costs 2x API Price, Still Hallucinates

OpenAI a lancé GPT-5.5, un modèle agent qui domine les benchmarks en codage et en mathématiques, dépassant ses concurrents. Cependant, des tests indépendants révèlent des taux d'hallucination plus élevés et des coûts d'API effectifs accrus.

hallucination Benchmarking Agentic AI AI Model

ARTICLEDEV.to AI·12/04/2026

Your RAG pipeline doesn't tell you when it's wrong. Here's how to fix that.

Ce texte traite de l'incapacité des pipelines RAG à signaler les erreurs des réponses LLM, même avec une grande confiance dans la récupération. Il propose une solution, telle que l'API Wauldo, pour comparer les affirmations de la réponse avec le texte source et en vérifier la véracité.

hallucination accuracy RAG AI evaluation

ARTICLEDEV.to AI·14/04/2026

Whisper Hallucination on Silence: Why Your Transcript Loops the Same Phrase

Ce contenu explore le phénomène d'hallucination dans le modèle Whisper, expliquant pourquoi les transcriptions peuvent répéter la même phrase. Il détaille les causes de ce comportement lorsque le modèle traite des périodes de silence.

hallucination audio processing Whisper Model AI