RESEARCH27
Investigating Counterfactual Unfairness in LLMs towards Identities through Humor
arXiv CS.CL·22 de abril de 2026
Este artigo investiga a injustiça contrafactual em LLMs, analisando como suas respostas ao humor mudam ao trocar identidades de falantes e ouvintes. A pesquisa revela disparidades relacionais consistentes, onde piadas contadas por falantes privilegiados são recusadas com mais frequência ou consideradas maliciosas pelos modelos.
Ler original ↗