RESEARCH27
Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges
arXiv CS.CL·26 de maio de 2026
Este artigo introduz uma estrutura causal para estudar o viés de racionalização em LLMs usados como juízes automáticos para avaliação de resumos e diálogos. Ele investiga se as classificações e explicações dos LLMs permanecem estáveis quando pistas não-evidenciais são perturbadas, propondo intervenções de pistas e métricas de ancoragem.
Ler original ↗