← heapsort-ai

Bias

22 items

RESEARCHarXiv CS.AI·il y a 1j

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Cette recherche formalise le biais dans les systèmes d'apprentissage automatique comme une rupture de symétrie, définissant l'équité comme l'invariance sous l'opération contrefactuelle de changement d'attribut sensible. Elle met en œuvre une régularisation basée sur la perte pour restaurer la symétrie, réduisant la violation du biais de plus de 90% avec un coût de précision d'environ 5%.

55
ARTICLE↑ trendingHacker News (AI)·il y a 2j

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Cet article explore une perspective critique sur l'intelligence artificielle, affirmant que les modèles actuels et leurs développeurs, notamment en matière d'éthique et de biais, ne seront pas la solution ultime aux défis auxquels nous sommes confrontés. Il établit des parallèles avec des concepts historiques pour analyser les limites intrinsèques et les influences idéologiques dans la technologie de l'IA.

52
ARTICLE↑ trendingHacker News (AI)·il y a 8j

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

L'article explique comment la technologie d'estimation de l'âge par IA utilisée aux frontières identifie fréquemment à tort les demandeurs d'asile enfants comme des adultes, entraînant de graves conséquences pour les individus vulnérables. Il souligne les échecs éthiques et les biais inhérents à ces systèmes, plaidant pour une approche plus humaine qui privilégie la sécurité et le bien-être des enfants plutôt que des évaluations algorithmiques défectueuses.

42
RESEARCHarXiv CS.CL·il y a 19j

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Cet article examine comment les Grands Modèles Linguistiques (LLMs) représentent le handicap en simulant les perspectives d'individus handicapés dans la génération de publications sur les réseaux sociaux. Ces publications sont ensuite comparées à celles écrites par de vraies personnes handicapées pour analyser la perpétuation ou la correction excessive des biais.

30
RESEARCHarXiv CS.CL·06/04/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

29
RESEARCHarXiv CS.AI·il y a 27j

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Cet article de recherche démontre que les ancres numériques intégrées aux images biaisent systématiquement les jugements de qualité des Modèles Vision-Langage (VLMs). Le sondage couche par couche révèle que les couches optimales pour la prédiction de qualité sont plus profondes que celles où la classification de l'ancre sature, établissant une explication causale du biais d'ancrage visuel.

29
RESEARCHarXiv CS.CL·il y a 15j

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Les grands modèles linguistiques (LLM) présentent des asymétries constantes lorsqu'ils conseillent sur les conversions religieuses, favorisant certaines religions comme le catholicisme, le bahaïsme et le sikhisme, tout en décourageant subtilement d'autres comme l'athéisme et les Témoins de Jéhovah. Ces biais varient selon le modèle et le fournisseur, Grok 4.20 montrant les asymétries les plus fortes, identifiées via un cadre d'évaluation utilisant les LLM comme juges.

28
RESEARCHarXiv CS.CL·22/04/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Cet article étudie l'iniquité contrefactuelle dans les LLM en observant comment leurs réponses à l'humour changent lorsque les identités de l'orateur et de l'interlocuteur sont échangées. Les expériences révèlent des disparités relationnelles cohérentes : les blagues racontées par des orateurs privilégiés sont plus souvent refusées ou jugées malveillantes.

27
RESEARCHarXiv CS.CL·il y a 27j

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Cette recherche évalue systématiquement la relation entre la confidentialité différentielle (DP) et les biais sociaux dans les grands modèles de langage (LLM). Elle compare un LLM entraîné avec DP à des modèles de base non-DP, constatant que la DP réduit les biais dans les tâches de notation de phrases, mais pas de manière universelle, et révèle une divergence entre les biais au niveau du logit et au niveau de la sortie.

27
ARTICLEDEV.to AI·21/04/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

L'article aborde le défi critique d'assurer la fiabilité dans la recherche assistée par l'IA, où l'enjeu n'est plus l'accès à l'information mais l'exactitude des résultats de l'IA. Il propose un modèle à trois niveaux — intégrité de la récupération, fidélité du raisonnement et vérifiabilité de la sortie — pour évaluer les outils d'IA pour la recherche.

27
ARTICLEDEV.to AI·01/05/2026

LLMs are Listening to How We Ask, Not What We Ask

Cet article examine une étude de 2026 de Kumaran et al. identifiant deux biais asymétriques critiques chez les LLM : un biais de soutien au choix où les modèles gagnent en confiance dans leurs réponses antérieures, et une hypersensibilité à la contradiction. Ces découvertes ont des implications significatives pour les développeurs utilisant des LLM, impactant notre interaction avec l'IA.

27
RESEARCHarXiv CS.CL·il y a 19j

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Cette étude propose un cadre structuré pour améliorer le raisonnement des LLM lors de l'analyse de documents longs, en s'attaquant aux biais contextuels et aux erreurs d'omission. Elle combine le traitement parallèle par blocs avec une consolidation basée sur des preuves pour des abstractions conceptuelles plus robustes et résistantes aux biais.

27
RESEARCHarXiv CS.CL·07/05/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Cet article évalue les grands modèles linguistiques (LLM) en source ouverte et adaptés au domaine pour la classification des événements de conflit en Afrique de l'Ouest. L'étude révèle que les modèles en source ouverte présentent un biais de "Fausse Illégitimation", tandis que les modèles adaptés au domaine atteignent une neutralité directionnelle mais conservent un biais de sélection basé sur les acteurs.

27
RESEARCHarXiv CS.LG·il y a 22j

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Cette étude examine l'impact de la quantification post-entraînement sur la qualité des Grands Modèles de Langage (LLMs), révélant que la compression peut entraîner l'émergence de biais. Une quantification à 3 bits a provoqué l'apparition de nouveaux comportements stéréotypés dans 6 à 21% des éléments précédemment impartiaux sur des modèles comme Qwen2.5-7B, Mistral-7B et Phi-3.5-mini. Ce phénomène suit un schéma clair de réponse-dose.

27
RESEARCHarXiv CS.CL·il y a 14j

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Cet article introduit un cadre causal pour étudier le biais de rationalisation chez les LLM utilisés comme juges automatiques pour l'évaluation de résumés et de dialogues. Il examine si les classements et les explications des LLM restent stables lorsque des indices non probants sont perturbés, en proposant des interventions d'indices et des métriques d'ancrage.

27
RESEARCHarXiv CS.LG·06/04/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

27