RESEARCH29
Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions
arXiv CS.AI·18 mai 2026
Cet article de recherche explore la déconnexion entre les résultats équitables des modèles linguistiques et leurs biais internes latents dans les décisions à enjeux élevés comme la souscription de prêts hypothécaires. Il démontre que, bien que les LLM puissent ne pas présenter de biais de sortie, ils retiennent et amplifient les représentations démographiques qui peuvent provoquer des inversions de décision, et ce biais est asimétrique.
Lire l'original ↗