RESEARCH27

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

arXiv CS.CL·13 de maio de 2026

Esta pesquisa avalia sistematicamente a relação entre privacidade diferencial (DP) e viés social em grandes modelos de linguagem (LLMs). O estudo compara um LLM treinado com DP a linhas de base sem DP, revelando que a DP reduz o viés em tarefas de pontuação de frases, mas essa melhoria não se generaliza para todas as tarefas, e há uma discrepância entre o viés em nível de logit e em nível de saída.

LLMs security AI ethics Bias

Ler original ↗