RESEARCH29

Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions

arXiv CS.AI·18 de maio de 2026

Este artigo de pesquisa explora a desconexão entre a produção justa de modelos de linguagem e seus vieses internos latentes em decisões de alto risco, como subscrição de hipotecas. Demonstra que, embora os LLMs possam não mostrar viés de saída, eles retêm e amplificam representações demográficas que podem causar reversões de decisão e que este viés é assimétrico.

LLM bias machine learning causality AI ethics fairness

Ler original ↗