RESEARCH27

Sanity Checks for Long-Form Hallucination Detection

arXiv CS.CL·12 de maio de 2026

Este artigo de pesquisa introduz uma metodologia de invariância controlada para detecção de alucinações em modelos de linguagem grandes. Utilizando testes oracle como extsc{Force} e extsc{Remove}, a pesquisa investiga se os métodos avaliam o raciocínio ou apenas correlatos superficiais da resposta final.

hallucination detection Chain-of-Thought large language models LLM evaluation

Ler original ↗