RESEARCH28

Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing

arXiv CS.CL·7. Mai 2026

Diese Studie untersucht Halluzinationen von Großen Sprachmodellen (ChatGPT, Grok, Gemini, Copilot) beim Generieren akademischer Inhalte mithilfe von 80 Prompts in vier Kategorien. Eine neue gewichtete Metrik, der Halluzinationsindex (HI), wurde eingeführt, um die faktische Genauigkeit und Referenzgültigkeit zu messen.

academic writing AI quality Model Evaluation hallucinations LLM

Original lesen ↗