RESEARCH28
Not All That Is Fluent Is Factual: Investigating Hallucinations of Large Language Models in Academic Writing
arXiv CS.CL·7. Mai 2026
Diese Studie untersucht Halluzinationen von Großen Sprachmodellen (ChatGPT, Grok, Gemini, Copilot) beim Generieren akademischer Inhalte mithilfe von 80 Prompts in vier Kategorien. Eine neue gewichtete Metrik, der Halluzinationsindex (HI), wurde eingeführt, um die faktische Genauigkeit und Referenzgültigkeit zu messen.
Original lesen ↗