RESEARCH28

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

arXiv CS.CL·7 de maio de 2026

Este estudo investiga as alucinações de LLMs (ChatGPT, Grok, Gemini, Copilot) na escrita acadêmica, utilizando 80 prompts em quatro categorias. Uma nova métrica ponderada, o Hallucination Index (HI), foi introduzida para medir a precisão factual e a validade das referências.

academic writing AI quality Model Evaluation hallucinations LLM

Ler original ↗