RESEARCH27
Sanity Checks for Long-Form Hallucination Detection
arXiv CS.CL·12 de mayo de 2026
Este trabajo de investigación presenta una metodología de invariancia controlada para la detección de alucinaciones en grandes modelos de lenguaje. Mediante pruebas de oráculo como extsc{Force} y extsc{Remove}, se explora si los métodos evalúan el razonamiento o solo correlatos superficiales de la respuesta final.
Leer original ↗