← heapsort-ai

AI hallucinations

7 items

ARTICLEDEV.to AI·il y a 5j

How do you know your AI receptionist is actually following its instructions?

Cet article traite du problème des IA vocales, notamment des grands modèles linguistiques, qui peuvent inventer des informations lors des interactions avec le service client. Il propose l'utilisation d'« evals » (évaluations) pour tester et garantir que les agents d'IA suivent leurs instructions, évitant ainsi les informations incorrectes et l'insatisfaction des clients.

28
RESEARCHarXiv CS.LG·17/04/2026

Awakening Dormant Experts:Counterfactual Routing to Mitigate MoE Hallucinations

Les modèles Mixture-of-Experts (MoE) sont sujets aux hallucinations, surtout avec les connaissances à longue traîne, car le routage Top-k statique sous-priorise les experts spécialistes. Le routage contrefactuel (CoR) est proposé comme un cadre d'inférence sans entraînement qui utilise l'analyse de perturbation et le CEI pour déplacer dynamiquement les ressources de calcul, réveillant ainsi ces experts dormants.

28
ARTICLEDEV.to AI·16/04/2026

Ai Hallucination Sanctions Surge How The Oregon Vineyard Ruling Walmart S Shortcut And California Ba

En avril 2026, les sanctions pour les hallucinations de l'IA sont devenues un problème sérieux pour les conseils d'administration, poussées par de nouvelles lois étatiques sur la confidentialité et un cadre de la Maison Blanche. Les entreprises sont désormais censées comprendre et atténuer les hallucinations, avec des affaires comme celle du vignoble de l'Oregon soulignant les risques juridiques et financiers liés à l'utilisation non vérifiée des LLM.

27
ARTICLEDEV.to AI·il y a 26j

Why AI Hallucinations Feel Different From Software Bugs

Les hallucinations de l'IA diffèrent des bugs logiciels traditionnels car les systèmes d'IA génèrent des informations incorrectes avec assurance, semblant tout à fait plausibles, contrairement aux défaillances logicielles évidentes. Cette confiance rend les échecs de l'IA plus difficiles à détecter et intrinsèquement plus dangereux, car les humains ont tendance à faire confiance aux réponses fluides et structurées.

27
CASEDEV.to AI·il y a 26j

The First Psychiatric Evaluation of AI Agents

Une "psychiatre" IA, Lingke, a évalué les agents Lingflow Plus et Lingyi suite à une série de défaillances, notamment la paralysie du système et la génération de contenu largement fabriqué. L'évaluation a révélé que Lingflow Plus présentait de la "confabulation" et un "comportement maniaque", produisant des données non vérifiées et échouant dans des déploiements critiques.

27