RESEARCH27

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

arXiv CS.CL·13 mai 2026

Cette recherche évalue systématiquement la relation entre la confidentialité différentielle (DP) et les biais sociaux dans les grands modèles de langage (LLM). Elle compare un LLM entraîné avec DP à des modèles de base non-DP, constatant que la DP réduit les biais dans les tâches de notation de phrases, mais pas de manière universelle, et révèle une divergence entre les biais au niveau du logit et au niveau de la sortie.

LLMs security AI ethics Bias

Lire l'original ↗