RESEARCH27
How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation
arXiv CS.CL·13 mai 2026
Cette recherche évalue systématiquement la relation entre la confidentialité différentielle (DP) et les biais sociaux dans les grands modèles de langage (LLM). Elle compare un LLM entraîné avec DP à des modèles de base non-DP, constatant que la DP réduit les biais dans les tâches de notation de phrases, mais pas de manière universelle, et révèle une divergence entre les biais au niveau du logit et au niveau de la sortie.
Lire l'original ↗