heapsort
RESEARCH27

Sanity Checks for Long-Form Hallucination Detection

arXiv CS.CL·12 mai 2026

Cet article de recherche introduit une méthodologie d'invariance contrôlée pour la détection des hallucinations dans les grands modèles de langage. En utilisant des tests oracle comme extsc{Force} et extsc{Remove}, il examine si les méthodes évaluent le raisonnement ou de simples corrélats superficiels de la réponse finale.

Lire l'original