← heapsort-ai

representational analysis

1 items

RESEARCHarXiv CS.CL·13/04/2026

A Representation-Level Assessment of Bias Mitigation in Foundation Models

Cette recherche examine comment l'atténuation des biais remodèle l'espace d'intégration des modèles de fondation, tels que BERT et Llama2. Les résultats montrent que l'atténuation des biais réduit les disparités genre-profession dans l'espace d'intégration, conduisant à des représentations internes plus neutres et validant l'analyse d'intégration comme un outil précieux pour les méthodes de débiaisage.

27