RESEARCH29
Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions
arXiv CS.AI·18 de maio de 2026
Este artigo de pesquisa explora a desconexão entre a produção justa de modelos de linguagem e seus vieses internos latentes em decisões de alto risco, como subscrição de hipotecas. Demonstra que, embora os LLMs possam não mostrar viés de saída, eles retêm e amplificam representações demográficas que podem causar reversões de decisão e que este viés é assimétrico.
Ler original ↗