← heapsort-ai

hallucinations

16 items

ARTICLE↑ trendingHacker News (AI)·vor 8Std

Trump's new AI order – hallucinations aren't just for LLMs

Der Artikel erörtert Trumps neue KI-Verordnung und zieht eine Parallele zwischen den „Halluzinationen“ großer Sprachmodelle (LLMs) und bestimmten politischen Aussagen. Er untersucht die Auswirkungen staatlicher Politik auf die KI und die öffentliche Wahrnehmung der Wahrheit im digitalen Zeitalter. Die Publikation hinterfragt die Konsistenz und Wahrhaftigkeit von Informationen, die aus verschiedenen Quellen stammen, sei es technologisch oder politisch.

76
RESEARCHarXiv CS.CL·vor 20Std

Evaluating Hallucinations in Domain-Adapted Large Language Models

Diese Studie untersucht Halluzinationen in domänenadaptierten Großen Sprachmodellen, insbesondere Llama-2, das mit dem Lamini-Datensatz feingetunt wurde. Es wurde festgestellt, dass seine Fähigkeit, über neue domänenspezifische Informationen genau zu argumentieren und sich daran zu erinnern, begrenzt bleibt, was zu Halluzinationen und einer Tendenz zur Übergenerierung führt.

55
ARTICLE↑ trendingReddit r/MachineLearning·5/6/2026

Stop letting LLMs edit your .bib [D]

Der Autor zeigt sich schockiert über die Häufigkeit von durch LLMs halluzinierten Zitaten in wissenschaftlichen Arbeiten, die zu falschen Autorenlisten führen. Er hinterfragt den mangelnden Respekt vor der Forschung und fordert strengere Strafen, während er fragt, ob andere ähnliche Probleme erleben.

42
RESEARCHarXiv CS.CL·5/7/2026

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

Diese Studie untersucht Halluzinationen von Großen Sprachmodellen (ChatGPT, Grok, Gemini, Copilot) beim Generieren akademischer Inhalte mithilfe von 80 Prompts in vier Kategorien. Eine neue gewichtete Metrik, der Halluzinationsindex (HI), wurde eingeführt, um die faktische Genauigkeit und Referenzgültigkeit zu messen.

28
RESEARCHarXiv CS.CL·vor 19T

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Diese Forschung untersucht, wie verschiedene niedrigbitige Quantisierungsstufen die Leistung von LLaMA-3.1 in der qualitativen Analyse beeinflussen, wobei festgestellt wird, dass Modelle mit geringer Bitrate oft Halluzinationen erzeugen. Es wird eine quantisierungsbewusste Mehrfach-Prompt-Verifizierungsmethode vorgeschlagen, um die Genauigkeit durch systematische Reduzierung von Halluzinationen und Filterung unzuverlässiger Inhalte zu verbessern.

28
RESEARCHarXiv CS.CL·4/20/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Große Sprachmodelle neigen dazu, faktisch inkorrekte Aussagen zu halluzinieren, ein Problem, das durch überwachtes Fine-Tuning (SFT) verstärkt wird, welches das vorab erworbene Wissen abbaut. Diese Forschung schlägt eine selbst-destillationsbasierte SFT-Methode vor, inspiriert vom kontinuierlichen Lernen, um Halluzinationen durch die Regularisierung der Ausgabe-Distributionsdrift zu mindern, während neue Fakten effektiv gelernt werden.

27
DOCDEV.to AI·5/6/2026

The "Logic Span": Using OpenTelemetry to Trace Hallucinations

Dieser Inhalt stellt die "Logic Span"-Methode vor, die OpenTelemetry nutzt, um Halluzinationen in großen Sprachmodellen (LLMs) zu verfolgen und zu debuggen. Indem jeder "Gedanke" oder "Schlussfolgerungsschritt" in einem dedizierten OTel Span gekapselt wird, können Entwickler genau identifizieren, wo die Logik eines LLM von seinem beabsichtigten Plan abweicht, und Halluzinationen wie einen Stack-Trace behandeln.

27
ARTICLEDEV.to AI·vor 29T

Prompt AI Coding Assistants to Build Production-Ready Agents: 8 Essential Patterns

Dieser Artikel behandelt die Bedeutung der Verwendung wesentlicher Muster, wenn KI-Codierungsassistenten angewiesen werden, produktionsreife Agenten zu erstellen. Durch die Spezifikation von Architektur-Entscheidungen können Fehler wie Halluzinationen und Token-Verschwendung vermieden werden, die oft unbemerkt bis zur Produktion auftreten.

27
RESEARCHarXiv CS.LG·4/28/2026

KARL: Mitigating Hallucinations in LLMs via Knowledge-Boundary-Aware Reinforcement Learning

KARL ist ein neuartiges Framework, das entwickelt wurde, um Halluzinationen in großen Sprachmodellen zu mindern, indem es ihnen ermöglicht, Fragen außerhalb ihres Wissensbereichs angemessen zu verweigern. Dies wird durch eine wissensgrenzenbewusste Belohnung erreicht, die das Wissen des Modells dynamisch einschätzt, und eine zweistufige RL-Trainingsstrategie, die übermäßige Vorsicht verhindert.

27
RESEARCHarXiv CS.CL·vor 20T

Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering

Dieses Papier argumentiert, dass aktuelle Unsicherheitsquantifizierungs-(UQ)-Methoden für LLMs lediglich unüberwachte Clustering-Algorithmen sind, die die interne Konsistenz der Modellgenerierungen statt deren externe Korrektheit messen. Folglich können diese Methoden „zuversichtliche Halluzinationen“ nicht erkennen und bei der Bereitstellung von LLMs in kritischen Bereichen ein trügerisches Gefühl der Sicherheit erzeugen.

27
ARTICLEDEV.to AI·vor 24T

Day 27: What GPT-4 Hallucinating 'Amritavati' Taught Me About Building Health AI for India

Die Erfahrung, dass GPT-4 ein fiktives Medikament namens „Amritavati“ halluziniert hat, verdeutlicht die Gefahren einer bloßen Übersetzung von KI für das Gesundheitswesen in Indien. Das Projekt GoDavaii zielt darauf ab, eine Gesundheits-KI zu entwickeln, die indische kulturelle und sprachliche Nuancen versteht, Hausmittel überprüft und sich an verschiedene Symptomausdrücke anpasst.

27
ARTICLEDEV.to AI·4/10/2026

Citation Needed: Structured data extraction workflows

Este artigo explora a construção de um fluxo de trabalho utilizando modelos de linguagem generativos para verificar se um texto fornece evidências para suas afirmações, útil para auto-crítica ou detecção de alucinações. A tarefa exige um grau de compreensão de leitura e rigor que apenas modelos de linguagem maiores e de fronteira podem abordar, superando as capacidades de pipelines de PNL tradicionais.

27
ARTICLEDeepLearning.AI (YouTube)·vor 27T

Why AI keeps lying to you

Der Artikel untersucht, warum KI-Modelle, insbesondere große Sprachmodelle, häufig ungenaue oder fabrizierte Informationen produzieren. Er erklärt, dass dieses Phänomen, oft als "Halluzination" oder "Lügen" bezeichnet, auf ihre probabilistische Natur und Trainingsdaten zurückzuführen ist, anstatt auf bewusste Täuschung.

Why AI keeps lying to you
22