RESEARCH29
Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions
arXiv CS.AI·18. Mai 2026
Diese Forschungsarbeit untersucht die Diskrepanz zwischen fairen Ausgaben von Sprachmodellen und ihren latenten internen Verzerrungen bei wichtigen Entscheidungen wie der Hypothekenbewertung. Es zeigt, dass LLMs zwar keine Ausgabenvoreingenommenheit aufweisen, jedoch demografische Darstellungen beibehalten und verstärken können, die zu Entscheidungsänderungen führen können, und diese Voreingenommenheit asymmetrisch ist.
Original lesen ↗