← heapsort-ai

hallucinations

17 items

ARTICLE↑ trendingHacker News (AI)·il y a 1j

Trump's new AI order – hallucinations aren't just for LLMs

L'article discute du nouveau décret de Trump sur l'IA, établissant un parallèle entre les « hallucinations » des grands modèles de langage (LLM) et certaines déclarations politiques. Il explore les implications de la politique gouvernementale sur l'IA et la perception publique de la vérité à l'ère numérique. La publication s'interroge sur la cohérence et la véracité des informations émanant de différentes sources, qu'elles soient technologiques ou politiques.

69
RESEARCHarXiv CS.LG·il y a 13h

Mitigating Manifold Departure: Uncertainty-Aware Subspace Rectification for Trustworthy MLLM Decoding

Les MLLM hallucinent fréquemment des objets incohérents avec les entrées visuelles, souvent attribué à une dépendance excessive aux priors linguistiques, conduisant à la "Manifold Departure". Manifold-Guided Adaptive Projection (MGAP) est proposé comme méthode de décodage sans entraînement pour atténuer les hallucinations tout en préservant la structure de représentation.

53
ARTICLE↑ trendingReddit r/MachineLearning·06/05/2026

Stop letting LLMs edit your .bib [D]

L'auteur exprime son étonnement face à la fréquence des citations hallucinées par les LLM dans les articles universitaires, entraînant des listes d'auteurs incorrectes. Il s'interroge sur le manque de respect pour la recherche et la nécessité de sanctions plus sévères, demandant si d'autres rencontrent le même problème.

42
RESEARCHarXiv CS.CL·il y a 1j

Evaluating Hallucinations in Domain-Adapted Large Language Models

Cette étude examine les hallucinations dans les grands modèles de langage adaptés à un domaine, en se concentrant sur le modèle Llama-2 affiné avec l'ensemble de données Lamini. Il a été constaté que sa capacité à raisonner et à se souvenir de nouvelles informations spécifiques au domaine reste limitée, entraînant des hallucinations et une tendance à la surgénération.

41
RESEARCHarXiv CS.CL·07/05/2026

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

Cette étude examine les hallucinations des grands modèles linguistiques (ChatGPT, Grok, Gemini, Copilot) dans la rédaction académique, à l'aide de 80 invites réparties en quatre catégories. Une nouvelle métrique pondérée, l'indice d'hallucination (HI), a été introduite pour mesurer la précision factuelle et la validité des références.

28
RESEARCHarXiv CS.CL·il y a 20j

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Cette recherche examine comment différents niveaux de quantification à faible bit affectent les performances de LLaMA-3.1 en analyse qualitative, notant que les modèles à faible bit produisent souvent des hallucinations. Elle propose une méthode de vérification de prompt multipasse sensible à la quantification pour améliorer la précision en réduisant systématiquement les hallucinations et en filtrant le contenu non fiable.

28
RESEARCHarXiv CS.CL·20/04/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Les grands modèles de langage sont souvent sujets aux hallucinations factuelles, un problème aggravé par le réglage fin supervisé (SFT) qui dégrade les connaissances pré-entraînées. Cette recherche propose une méthode SFT basée sur l'auto-distillation, inspirée de l'apprentissage continu, pour atténuer les hallucinations en régularisant la dérive de la distribution de sortie, tout en acquérant efficacement de nouvelles informations factuelles.

27
DOCDEV.to AI·06/05/2026

The "Logic Span": Using OpenTelemetry to Trace Hallucinations

Ce contenu présente la méthode "Logic Span", qui utilise OpenTelemetry pour tracer et déboguer les hallucinations dans les Grands Modèles Linguistiques (LLMs). En encapsulant chaque "Pensée" ou "Étape de Raisonnement" dans un Span OTel dédié, les développeurs peuvent identifier précisément où la logique d'un LLM diverge de son plan initial, traitant les hallucinations comme une trace de pile.

27
ARTICLEDEV.to AI·11/05/2026

Prompt AI Coding Assistants to Build Production-Ready Agents: 8 Essential Patterns

Cet article traite de l'importance d'utiliser des modèles essentiels lors de l'instruction des assistants de codage IA pour construire des agents prêts pour la production. En spécifiant les décisions d'architecture, on peut prévenir les échecs comme les hallucinations et le gaspillage de jetons, qui surviennent souvent silencieusement jusqu'à la production.

27
RESEARCHarXiv CS.LG·28/04/2026

KARL: Mitigating Hallucinations in LLMs via Knowledge-Boundary-Aware Reinforcement Learning

KARL est un nouveau cadre conçu pour atténuer les hallucinations dans les grands modèles linguistiques en leur permettant de s'abstenir de manière appropriée des questions dépassant leurs connaissances. Il y parvient grâce à une récompense sensible aux limites de la connaissance qui estime dynamiquement le savoir du modèle et à une stratégie d'entraînement RL en deux étapes qui prévient la prudence excessive.

27
RESEARCHarXiv CS.CL·il y a 21j

Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering

Cet article affirme que les méthodes actuelles de Quantification de l'Incertitude (UQ) pour les LLM sont en fait des algorithmes de clustering non supervisé, mesurant la cohérence interne des générations du modèle plutôt que leur exactitude externe. Par conséquent, ces méthodes ne parviennent pas à détecter les "hallucinations confiantes" et peuvent créer un faux sentiment de sécurité lors du déploiement de LLM dans des domaines à enjeux élevés.

27
ARTICLEDEV.to AI·il y a 25j

Day 27: What GPT-4 Hallucinating 'Amritavati' Taught Me About Building Health AI for India

L'expérience du GPT-4 halluciné un médicament fictif, "Amritavati", souligne les dangers de la simple traduction de l'IA pour les soins de santé en Inde. Le projet GoDavaii vise à développer une IA de santé qui comprend les nuances culturelles et linguistiques indiennes, vérifiant les remèdes maison et s'adaptant aux diverses expressions de symptômes.

27
ARTICLEDEV.to AI·10/04/2026

Citation Needed: Structured data extraction workflows

Este artigo explora a construção de um fluxo de trabalho utilizando modelos de linguagem generativos para verificar se um texto fornece evidências para suas afirmações, útil para auto-crítica ou detecção de alucinações. A tarefa exige um grau de compreensão de leitura e rigor que apenas modelos de linguagem maiores e de fronteira podem abordar, superando as capacidades de pipelines de PNL tradicionais.

27
ARTICLEDeepLearning.AI (YouTube)·il y a 27j

Why AI keeps lying to you

L'article explore les raisons pour lesquelles les modèles d'IA, en particulier les grands modèles linguistiques, produisent fréquemment des informations inexactes ou fabriquées. Il explique que ce phénomène, souvent appelé "hallucination" ou "mensonge", découle de leur nature probabiliste et de leurs données d'entraînement, plutôt que d'une tromperie délibérée.

Why AI keeps lying to you
22