heapsort
RESEARCH29

Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions

arXiv CS.AI·18. Mai 2026

Diese Forschungsarbeit untersucht die Diskrepanz zwischen fairen Ausgaben von Sprachmodellen und ihren latenten internen Verzerrungen bei wichtigen Entscheidungen wie der Hypothekenbewertung. Es zeigt, dass LLMs zwar keine Ausgabenvoreingenommenheit aufweisen, jedoch demografische Darstellungen beibehalten und verstärken können, die zu Entscheidungsänderungen führen können, und diese Voreingenommenheit asymmetrisch ist.

Original lesen