RESEARCH27
Sanity Checks for Long-Form Hallucination Detection
arXiv CS.CL·12 de maio de 2026
Este artigo de pesquisa introduz uma metodologia de invariância controlada para detecção de alucinações em modelos de linguagem grandes. Utilizando testes oracle como extsc{Force} e extsc{Remove}, a pesquisa investiga se os métodos avaliam o raciocínio ou apenas correlatos superficiais da resposta final.
Ler original ↗