heapsort
RESEARCH29

Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions

arXiv CS.AI·18 de maio de 2026

Este artigo de pesquisa explora a desconexão entre a produção justa de modelos de linguagem e seus vieses internos latentes em decisões de alto risco, como subscrição de hipotecas. Demonstra que, embora os LLMs possam não mostrar viés de saída, eles retêm e amplificam representações demográficas que podem causar reversões de decisão e que este viés é assimétrico.

Ler original