RESEARCH27

Sanity Checks for Long-Form Hallucination Detection

arXiv CS.CL·12 de mayo de 2026

Este trabajo de investigación presenta una metodología de invariancia controlada para la detección de alucinaciones en grandes modelos de lenguaje. Mediante pruebas de oráculo como extsc{Force} y extsc{Remove}, se explora si los métodos evalúan el razonamiento o solo correlatos superficiales de la respuesta final.

hallucination detection Chain-of-Thought large language models LLM evaluation

Leer original ↗