RESEARCH27

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

arXiv CS.CL·26. Mai 2026

Dieser Artikel stellt einen kausalen Rahmen zur Untersuchung von Rationalisierungsverzerrungen bei LLMs vor, die als automatische Juroren für Zusammenfassungs- und Dialogbewertungen eingesetzt werden. Er untersucht, ob die Bewertungen und Erklärungen von LLMs stabil bleiben, wenn nicht-evidente Hinweise gestört werden, und schlägt Hinweisinterventionen und Ankerkennzahlen vor.

LLMs evaluation AI rationalization Bias

Original lesen ↗