← heapsort-ai

hallucination

28 items

RESEARCH↑ trendingReddit r/MachineLearning·4/24/2026

New project about llm hallucination [P]

Dieser Inhalt stellt ein neues Nebenprojekt und dessen GitHub-Repository vor, das sich auf die Minderung von LLM-Halluzinationen mittels einer neuartigen Methode des kontrastiven Samplings und selektiven Trainings konzentriert. Die Kernidee behandelt Halluzination als ein Präferenzproblem, indem sie selbstgenerierte negative Beispiele und divergenzbasiertes, selektives Lernen nutzt, um korrekte Antworten zu fördern und falsche zu unterdrücken.

New project about llm hallucination [P]
45
ARTICLE↑ trendingReddit r/LocalLLaMA·4/18/2026

Are you guys actually using local tool calling or is it a collective prank?

Ein Nutzer äußert Frustration über die lokale Tool-Calling-Funktionalität von LLMs wie Qwen und Gemma, da er beim Versuch, Dateien zu erstellen, Halluzinationen und Ausführungsschleifen erlebt. Er fragt sich, ob diese Schwierigkeit eine Einschränkung kleiner Modelle oder ein Einrichtungsfehler bei Open WebUI und LM Studio ist.

33
RESEARCHarXiv CS.CL·4/23/2026

Do Hallucination Neurons Generalize? Evidence from Cross-Domain Transfer in LLMs

Neue Forschungsergebnisse deuten darauf hin, dass „Halluzinationsneuronen“ (H-Neuronen), die LLM-Halluzinationen vorhersagen, nicht über verschiedene Wissensdomänen hinweg verallgemeinerbar sind. Dies deutet darauf hin, dass Halluzination möglicherweise kein einzelner Mechanismus mit einer universellen neuronalen Signatur ist, sondern kontextabhängig.

30
RESEARCHarXiv CS.CL·vor 13T

Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations

Die Studie untersucht, warum LLMs bei der Argumentation über linearisiertes strukturiertes Wissen halluzinieren. Sie zeigt, dass Halluzinationen auf systematische interne Dynamiken zurückzuführen sind, wie die Konzentration der Aufmerksamkeit auf Shortcut-Hinweise und das Versagen von Feed-Forward-Schichten, das bereitgestellte Wissen zu verankern.

29
RESEARCHarXiv CS.LG·4/20/2026

Hallucination as Trajectory Commitment: Causal Evidence for Asymmetric Attractor Dynamics in Transformer Generation

Die Arbeit liefert kausale Belege dafür, dass Halluzinationen in autoregressiven Sprachmodellen ein frühes Trajektorienengagement sind, das durch asymmetrische Attraktordynamiken bestimmt wird. Die Forschung zeigt, dass sich faktische und halluzinierte Trajektorien bereits beim ersten Token trennen, und die Korrektur eines halluzinierten Pfades anhaltende Intervention erfordert, während Korruption leichter ist.

27
RESEARCHarXiv CS.CL·5/7/2026

MedFabric and EtHER: A Data-Centric Framework for Word-Level Fabrication Generation and Detection in Medical LLMs

Dieses Papier stellt MedFabric vor, eine datenzentrierte Pipeline zur Generierung realistischer und wortbasierter Falschaussagen in medizinischen LLMs, die Mängel in bestehenden Datensätzen behebt. Es präsentiert auch ETHER, einen modularen wortbasierten Falschaussagen-Detektor, der verschiedene Techniken zur Verbesserung der faktischen Bewertung integriert.

27
ARTICLEDEV.to AI·vor 27T

Building a production-ready RAG pipeline

Große Sprachmodelle (LLMs) halluzinieren oft, wenn ihnen aktueller Kontext oder spezifisches Wissen fehlt. Retrieval-Augmented Generation (RAG) behebt dies, indem es LLMs externe, relevante Daten bereitstellt, wodurch sie genaue Antworten generieren können; der Autor baute Keystone, um RAG auf die Aktivität von GitHub-Repositories anzuwenden.

27
ARTICLEDEV.to AI·5/9/2026

Someone Called My AI System a Tool. Then They Showed Me Theirs.

Der Autor berichtet von einem Konferenzgespräch, bei dem sein komplexes KI-System mit Fälschungsschutz und persistentem Speicher als "Werkzeug" bezeichnet wurde. Dies wird dem einfacheren Agenten-Framework eines anderen Teilnehmers gegenübergestellt, was eine Diskussion über das entscheidende Fehlen von Schutzmechanismen gegen KI-Halluzinationen in letzterem auslöste.

27
RESEARCHarXiv CS.CL·4/15/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Diese Arbeit stellt VLM-DeflectionBench vor, einen neuen Benchmark für große Vision-Sprachmodelle (LVLMs), der sich auf Ablenkung und Halluzination konzentriert, wenn mit widersprüchlichen oder unzureichenden Beweisen umgegangen wird. Sie schlägt außerdem eine dynamische Datenkuratierungspipeline vor, um die Schwierigkeit des Benchmarks im Laufe der Zeit aufrechtzuerhalten, sowie ein feingranulares Evaluierungsprotokoll, um das Modellverhalten zu entflechten.

27
RESEARCHarXiv CS.CL·4/15/2026

Think Through Uncertainty: Improving Long-Form Generation Factuality via Reasoning Calibration

Diese Forschung stellt CURE vor, ein neuartiges Framework zur Verbesserung der Faktizität von Langform-Generierungen durch LLMs, indem es ihnen beibringt, Unsicherheit auf Behauptungsebene zu bewerten. Es überwindet die Tendenz von Modellen, unzutreffende Behauptungen selbstbewusst zu äußern, und konzentriert sich stattdessen auf eine granulare Unsicherheitskalibrierung.

27
RESEARCHarXiv CS.CL·4/9/2026

Hallucination as output-boundary misclassification: a composite abstention architecture for language models

Este artigo enquadra a alucinação em grandes modelos de linguagem como um erro de classificação e propõe uma intervenção composta por recusa baseada em instruções e um gate de abstenção estrutural. O gate utiliza um score de déficit de suporte de sinais como auto-consistência e cobertura de citação, mas a avaliação controlada mostrou que nenhum mecanismo isolado foi suficiente para mitigar totalmente o problema.

27