RESEARCHarXiv CS.CL·hace 14d
Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges
Este artículo presenta un marco causal para estudiar el sesgo de racionalización en LLMs utilizados como jueces automáticos para la evaluación de resúmenes y diálogos. Investiga si las clasificaciones y explicaciones de los LLMs permanecen estables cuando se perturban las señales no evidenciales, proponiendo intervenciones de señales y métricas de anclaje.
27