RESEARCH29

Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions

arXiv CS.AI·18 mai 2026

Cet article de recherche explore la déconnexion entre les résultats équitables des modèles linguistiques et leurs biais internes latents dans les décisions à enjeux élevés comme la souscription de prêts hypothécaires. Il démontre que, bien que les LLM puissent ne pas présenter de biais de sortie, ils retiennent et amplifient les représentations démographiques qui peuvent provoquer des inversions de décision, et ce biais est asimétrique.

LLM bias machine learning causality AI ethics Fairness

Lire l'original ↗