RESEARCH27
Sanity Checks for Long-Form Hallucination Detection
arXiv CS.CL·12 mai 2026
Cet article de recherche introduit une méthodologie d'invariance contrôlée pour la détection des hallucinations dans les grands modèles de langage. En utilisant des tests oracle comme extsc{Force} et extsc{Remove}, il examine si les méthodes évaluent le raisonnement ou de simples corrélats superficiels de la réponse finale.
Lire l'original ↗