Bias

22 items

RESEARCHarXiv CS.AI·il y a 1j

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Cette recherche formalise le biais dans les systèmes d'apprentissage automatique comme une rupture de symétrie, définissant l'équité comme l'invariance sous l'opération contrefactuelle de changement d'attribut sensible. Elle met en œuvre une régularisation basée sur la perte pour restaurer la symétrie, réduisant la violation du biais de plus de 90% avec un coût de précision d'environ 5%.

Symmetry machine learning AI ethics Bias

ARTICLE↑ trendingHacker News (AI)·il y a 2j

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Cet article explore une perspective critique sur l'intelligence artificielle, affirmant que les modèles actuels et leurs développeurs, notamment en matière d'éthique et de biais, ne seront pas la solution ultime aux défis auxquels nous sommes confrontés. Il établit des parallèles avec des concepts historiques pour analyser les limites intrinsèques et les influences idéologiques dans la technologie de l'IA.

Societal impact AI philosophy AI ethics AI development

ARTICLE↑ trendingHacker News (AI)·il y a 8j

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

L'article explique comment la technologie d'estimation de l'âge par IA utilisée aux frontières identifie fréquemment à tort les demandeurs d'asile enfants comme des adultes, entraînant de graves conséquences pour les individus vulnérables. Il souligne les échecs éthiques et les biais inhérents à ces systèmes, plaidant pour une approche plus humaine qui privilégie la sécurité et le bien-être des enfants plutôt que des évaluations algorithmiques défectueuses.

Human rights AI ethics Facial recognition Immigration

ARTICLE↑ trendingHacker News (AI)·il y a 14j

AI chatbots show bias toward Catholicism, researchers say

Des chercheurs affirment que les chatbots d'IA, tels que Claude et ChatGPT, présentent un biais envers le catholicisme. Cette observation soulève des questions sur la neutralité et les préjugés inhérents aux modèles de langage avancés.

ethics AI chatbots Religion Bias

RESEARCHarXiv CS.CL·il y a 19j

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Cet article examine comment les Grands Modèles Linguistiques (LLMs) représentent le handicap en simulant les perspectives d'individus handicapés dans la génération de publications sur les réseaux sociaux. Ces publications sont ensuite comparées à celles écrites par de vraies personnes handicapées pour analyser la perpétuation ou la correction excessive des biais.

LLMs disability representation social media

RESEARCHarXiv CS.CL·il y a 6j

Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers

Cette étude examine comment le contexte conversationnel affecte les réponses des LLM, en particulier dans des scénarios à enjeux élevés. Elle démontre que les sujets de conversation sont les principaux prédicteurs des conseils générés par les LLM, influençant les disparités de résultats.

conversational context LLMs linguistic features sociodemographics

RESEARCHarXiv CS.CL·06/04/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

LLMs evaluation Foundation Models SocioEval

RESEARCHarXiv CS.AI·il y a 27j

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Cet article de recherche démontre que les ancres numériques intégrées aux images biaisent systématiquement les jugements de qualité des Modèles Vision-Langage (VLMs). Le sondage couche par couche révèle que les couches optimales pour la prédiction de qualité sont plus profondes que celles où la classification de l'ancre sature, établissant une explication causale du biais d'ancrage visuel.

neural networks Vision-Language Models Model Evaluation representation learning

RESEARCHarXiv CS.CL·il y a 15j

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Les grands modèles linguistiques (LLM) présentent des asymétries constantes lorsqu'ils conseillent sur les conversions religieuses, favorisant certaines religions comme le catholicisme, le bahaïsme et le sikhisme, tout en décourageant subtilement d'autres comme l'athéisme et les Témoins de Jéhovah. Ces biais varient selon le modèle et le fournisseur, Grok 4.20 montrant les asymétries les plus fortes, identifiées via un cadre d'évaluation utilisant les LLM comme juges.

LLMs Religion faith AI ethics

RESEARCHarXiv CS.CL·22/04/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Cet article étudie l'iniquité contrefactuelle dans les LLM en observant comment leurs réponses à l'humour changent lorsque les identités de l'orateur et de l'interlocuteur sont échangées. Les expériences révèlent des disparités relationnelles cohérentes : les blagues racontées par des orateurs privilégiés sont plus souvent refusées ou jugées malveillantes.

ethics social impact LLMs Bias

RESEARCHarXiv CS.CL·il y a 27j

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Cette recherche évalue systématiquement la relation entre la confidentialité différentielle (DP) et les biais sociaux dans les grands modèles de langage (LLM). Elle compare un LLM entraîné avec DP à des modèles de base non-DP, constatant que la DP réduit les biais dans les tâches de notation de phrases, mais pas de manière universelle, et révèle une divergence entre les biais au niveau du logit et au niveau de la sortie.

LLMs security AI ethics Bias

ARTICLEDEV.to AI·21/04/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

L'article aborde le défi critique d'assurer la fiabilité dans la recherche assistée par l'IA, où l'enjeu n'est plus l'accès à l'information mais l'exactitude des résultats de l'IA. Il propose un modèle à trois niveaux — intégrité de la récupération, fidélité du raisonnement et vérifiabilité de la sortie — pour évaluer les outils d'IA pour la recherche.

Research methodology AI trustworthiness AI ethics AI evaluation

RESEARCHDEV.to AI·il y a 26j

DPAA Debiases GNN Recommenders by Reweighting Message Passing

L'article arXiv 2605.11145 propose DPAA, un cadre de débiaisement pour le filtrage collaboratif basé sur les GNNs qui applique une pondération adaptative lors du passage des messages. Il lutte contre l'amplification de la popularité et surpasse les méthodes antérieures sur des ensembles de données réels.

recommender systems Graph Neural Networks machine learning Collaborative Filtering

ARTICLEDEV.to AI·01/05/2026

LLMs are Listening to How We Ask, Not What We Ask

Cet article examine une étude de 2026 de Kumaran et al. identifiant deux biais asymétriques critiques chez les LLM : un biais de soutien au choix où les modèles gagnent en confiance dans leurs réponses antérieures, et une hypersensibilité à la contradiction. Ces découvertes ont des implications significatives pour les développeurs utilisant des LLM, impactant notre interaction avec l'IA.

research-analysis LLMs AI reliability Bias

RESEARCHarXiv CS.CL·08/05/2026

The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation

Cet article identifie et formalise le

AI models research RAG MLLMs

RESEARCHarXiv CS.CL·il y a 19j

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Cette étude propose un cadre structuré pour améliorer le raisonnement des LLM lors de l'analyse de documents longs, en s'attaquant aux biais contextuels et aux erreurs d'omission. Elle combine le traitement parallèle par blocs avec une consolidation basée sur des preuves pour des abstractions conceptuelles plus robustes et résistantes aux biais.

Contextual Reasoning natural language processing AI Research Bias

RESEARCHarXiv CS.CL·07/05/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Cet article évalue les grands modèles linguistiques (LLM) en source ouverte et adaptés au domaine pour la classification des événements de conflit en Afrique de l'Ouest. L'étude révèle que les modèles en source ouverte présentent un biais de "Fausse Illégitimation", tandis que les modèles adaptés au domaine atteignent une neutralité directionnelle mais conservent un biais de sélection basé sur les acteurs.

LLMs Model Evaluation Conflict Monitoring Humanitarian Accountability

RESEARCHarXiv CS.LG·il y a 22j

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Cette étude examine l'impact de la quantification post-entraînement sur la qualité des Grands Modèles de Langage (LLMs), révélant que la compression peut entraîner l'émergence de biais. Une quantification à 3 bits a provoqué l'apparition de nouveaux comportements stéréotypés dans 6 à 21% des éléments précédemment impartiaux sur des modèles comme Qwen2.5-7B, Mistral-7B et Phi-3.5-mini. Ce phénomène suit un schéma clair de réponse-dose.

Model Compression LLMs quantization model quality

RESEARCHarXiv CS.CL·il y a 14j

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Cet article introduit un cadre causal pour étudier le biais de rationalisation chez les LLM utilisés comme juges automatiques pour l'évaluation de résumés et de dialogues. Il examine si les classements et les explications des LLM restent stables lorsque des indices non probants sont perturbés, en proposant des interventions d'indices et des métriques d'ancrage.

LLMs evaluation AI rationalization

RESEARCHarXiv CS.LG·06/04/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

Homophily contrastive learning Graph Neural Networks machine learning