RESEARCH28
Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing
arXiv CS.CL·7 de maio de 2026
Este estudo investiga as alucinações de LLMs (ChatGPT, Grok, Gemini, Copilot) na escrita acadêmica, utilizando 80 prompts em quatro categorias. Uma nova métrica ponderada, o Hallucination Index (HI), foi introduzida para medir a precisão factual e a validade das referências.
Ler original ↗