hallucination

28 items

RESEARCHarXiv CS.LG·vor 29T

Breaking the Illusion: When Positive Meets Negative in Multimodal Decoding

Ein neues trainingsfreies Inferenz-Framework, Positive-and-Negative Decoding (PND), wird eingeführt, um Objekthalluzinationen in Vision-Language Models (VLMs) zu begegnen. PND erzwingt visuelle Treue durch einen Dual-Path-Kontrastmechanismus und erreicht Spitzenleistungen ohne erneutes Training.

multimodal AI hallucination Vision-Language Models decoding

RESEARCHarXiv CS.CL·vor 15T

Graph Alignment Topology as an Inductive Bias for Grounding Detection

Große Sprachmodelle (LLMs) sind darauf optimiert, plausible Fortsetzungen zu erzeugen, anstatt explizit zu überprüfen, ob generierte Aussagen durch Quelldokumente gestützt werden, was ihren Einsatz in kritischen Bereichen einschränkt. Diese Forschung schlägt vor, die Ausrichtungstopologie als induktiven Bias zu nutzen, indem aus Referenzinformationen und LLM-Ausgaben ausgerichtete bipartite Graphen konstruiert und ein Graph Neural Network (GNN) trainiert wird.

LLMs hallucination grounding detection GNNs

ARTICLEDEV.to AI·4/24/2026

I Built a Multi-LLM Debate Engine That Fact-Checks Itself in Real Time

Der Artikel beschreibt den Bau einer Multi-LLM-Debattier-Engine, die sich in Echtzeit selbst faktencheckt, um die Neigung von LLMs zu Schmeichelei und Halluzinationen zu bekämpfen. Er schlägt eine strukturierte Debatte zwischen Agenten mit unterschiedlichen Rollen vor, einschließlich eines engagierten Faktenprüfers während der Debatte.

AI models LLMs hallucination multi-agent systems

ARTICLEKDNuggets·vor 29T

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

Dieser Artikel behandelt die Implementierung einer Infrastruktur zur Messung und Kontrolle übermäßig ausführlicher LLM-Antworten und „Halluzinationen“. Der Schwerpunkt liegt auf der Implementierung von Leitplanken, um kontrolliertere und präzisere KI-Ausgaben zu gewährleisten.

hallucination AI quality guardrails LLM

Guardrails for LLMs: Measuring AI ‘Hallucination’ and Verbosity

RESEARCHarXiv CS.AI·4/8/2026

Pramana: Fine-Tuning Large Language Models for Epistemic Reasoning through Navya-Nyaya

Grandes modelos de linguagem (LLMs) falham em raciocínio sistemático e frequentemente alucinam, expondo uma lacuna epistêmica. Pramana é uma nova abordagem que ensina metodologia epistemológica explícita a LLMs, através de fine-tuning na lógica Navya-Nyaya, um framework de raciocínio indiano milenar.

Epistemic Reasoning hallucination large language models Fine-tuning

NEWSDEV.to AI·4/25/2026

GPT-5.5 Tops Benchmarks, Costs 2x API Price, Still Hallucinates

OpenAI hat GPT-5.5 eingeführt, ein agentisches Modell, das Benchmarks in Codierung und Mathematik übertrifft und Konkurrenten hinter sich lässt. Unabhängige Tests zeigen jedoch höhere Halluzinationsraten und gestiegene effektive API-Kosten.

hallucination Benchmarking Agentic AI AI model

ARTICLEDEV.to AI·4/12/2026

Your RAG pipeline doesn't tell you when it's wrong. Here's how to fix that.

Dieser Artikel erörtert das Versagen von RAG-Pipelines, nicht anzuzeigen, wann LLM-Antworten falsch sind, selbst bei hoher Retrieval-Konfidenz. Er präsentiert eine Lösung, wie die Wauldo API, um die Behauptungen in der Antwort mit dem Quelltext abzugleichen und deren Richtigkeit zu überprüfen.

hallucination accuracy RAG AI evaluation

ARTICLEDEV.to AI·4/14/2026

Whisper Hallucination on Silence: Why Your Transcript Loops the Same Phrase

Dieser Inhalt untersucht das Phänomen der Halluzination im Whisper-Modell und erklärt, warum Transkripte dieselbe Phrase wiederholen können. Er erläutert die Ursachen dieses Verhaltens, wenn das Modell Stilleperioden verarbeitet.

hallucination audio processing Whisper Model AI