RESEARCH27

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

arXiv CS.CL·13. Mai 2026

Diese Forschung bewertet systematisch die Beziehung zwischen differenzieller Privatsphäre (DP) und sozialer Voreingenommenheit in großen Sprachmodellen (LLMs). Sie vergleicht ein DP-trainiertes LLM mit Nicht-DP-Baselines und stellt fest, dass DP die Voreingenommenheit bei Satzbewertungsaufgaben reduziert, dies jedoch nicht für alle Aufgaben gilt, und zeigt eine Diskrepanz zwischen Logit-Level- und Output-Level-Voreingenommenheit auf.

LLMs security AI ethics Bias

Original lesen ↗