RESEARCH27
How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation
arXiv CS.CL·13 de maio de 2026
Esta pesquisa avalia sistematicamente a relação entre privacidade diferencial (DP) e viés social em grandes modelos de linguagem (LLMs). O estudo compara um LLM treinado com DP a linhas de base sem DP, revelando que a DP reduz o viés em tarefas de pontuação de frases, mas essa melhoria não se generaliza para todas as tarefas, e há uma discrepância entre o viés em nível de logit e em nível de saída.
Ler original ↗