RESEARCH27
How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation
arXiv CS.CL·13. Mai 2026
Diese Forschung bewertet systematisch die Beziehung zwischen differenzieller Privatsphäre (DP) und sozialer Voreingenommenheit in großen Sprachmodellen (LLMs). Sie vergleicht ein DP-trainiertes LLM mit Nicht-DP-Baselines und stellt fest, dass DP die Voreingenommenheit bei Satzbewertungsaufgaben reduziert, dies jedoch nicht für alle Aufgaben gilt, und zeigt eine Diskrepanz zwischen Logit-Level- und Output-Level-Voreingenommenheit auf.
Original lesen ↗