RESEARCH27
Sanity Checks for Long-Form Hallucination Detection
arXiv CS.CL·12. Mai 2026
Diese Forschungsarbeit stellt eine kontrollierte Invarianzmethodologie zur Erkennung von Halluzinationen in großen Sprachmodellen vor. Mittels Orakeltests wie extsc{Force} und extsc{Remove} wird untersucht, ob Detektionsmethoden das Denken oder lediglich Oberflächenkorrelate der finalen Antwort bewerten.
Original lesen ↗