RESEARCH27

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

arXiv CS.CL·26 de mayo de 2026

Este artículo presenta un marco causal para estudiar el sesgo de racionalización en LLMs utilizados como jueces automáticos para la evaluación de resúmenes y diálogos. Investiga si las clasificaciones y explicaciones de los LLMs permanecen estables cuando se perturban las señales no evidenciales, proponiendo intervenciones de señales y métricas de anclaje.

LLMs evaluation AI rationalization Bias

Leer original ↗