Bias

22 items

RESEARCHarXiv CS.AI·vor 1T

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Diese Forschung formalisiert Voreingenommenheit in maschinellen Lernsystemen als Symmetriebrechung und definiert Fairness als Invarianz unter dem kontrafaktischen Wechsel sensibler Attribute. Sie implementiert verlustbasierte Regularisierung zur Wiederherstellung der Symmetrie und erreicht über 90% Reduktion von Voreingenommenheitsverletzungen mit etwa 5% Genauigkeitskosten.

Symmetry machine learning AI ethics Bias

ARTICLE↑ trendingHacker News (AI)·vor 2T

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Dieser Artikel beleuchtet eine kritische Perspektive auf künstliche Intelligenz und argumentiert, dass aktuelle Modelle und ihre Entwickler, insbesondere in Bezug auf Ethik und Voreingenommenheit, nicht die endgültige Lösung für unsere Herausforderungen sein werden. Er zieht Parallelen zu historischen Konzepten, um die inhärenten Grenzen und ideologischen Einflüsse in der KI-Technologie zu analysieren.

Societal impact AI philosophy AI ethics AI development

ARTICLE↑ trendingHacker News (AI)·vor 8T

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

Der Artikel erörtert, wie KI-Altersätzungstechnologien an Grenzen oft fälschlicherweise kindliche Asylsuchende als Erwachsene identifizieren, was schwerwiegende Folgen für schutzbedürftige Personen hat. Er beleuchtet die ethischen Mängel und inhärenten Vorurteile dieser Systeme und plädiert für einen humaneren Ansatz, der die Sicherheit und das Wohlergehen von Kindern über fehlerhafte algorithmische Bewertungen stellt.

Human rights AI ethics Facial recognition Immigration

ARTICLE↑ trendingHacker News (AI)·vor 14T

AI chatbots show bias toward Catholicism, researchers say

Forscher behaupten, dass KI-Chatbots, wie Claude und ChatGPT, eine Voreingenommenheit gegenüber dem Katholizismus zeigen. Diese Beobachtung wirft Fragen zur Neutralität und den inhärenten Vorurteilen in fortgeschrittenen Sprachmodellen auf.

ethics AI chatbots Religion Bias

RESEARCHarXiv CS.CL·vor 19T

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Dieses Papier untersucht, wie große Sprachmodelle (LLMs) Behinderung darstellen, indem sie die Perspektiven von Menschen mit Behinderungen bei der Erstellung von Social-Media-Beiträgen simulieren. Diese Beiträge werden dann mit denen von echten Menschen mit Behinderungen verglichen, um die Perpetuierung oder Überkorrektur von Vorurteilen zu analysieren.

LLMs disability representation social media

RESEARCHarXiv CS.CL·vor 6T

Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers

Diese Studie untersucht, wie der Konversationskontext die Antworten von LLMs beeinflusst, insbesondere in risikoreichen Szenarien. Sie zeigt, dass Konversationsthemen die Hauptprädiktoren für LLM-generierte Ratschläge sind und die Ergebnisungleichheiten beeinflussen.

conversational context LLMs linguistic features sociodemographics

RESEARCHarXiv CS.CL·4/6/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

LLMs evaluation Foundation Models SocioEval

RESEARCHarXiv CS.AI·vor 27T

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Diese Forschungsarbeit zeigt, dass eingebettete numerische Anker auf Bildern systematisch die Qualitätsurteile von Vision-Language-Modellen (VLMs) verzerren. Schichtweise Sondierungen offenbaren, dass optimale Schichten für die Qualitätsprognose tiefer liegen als jene, in denen die Ankerklassifizierung sättigt, was eine kausale Erklärung für die visuelle Verankerungsverzerrung liefert.

neural networks Vision-Language Models Model Evaluation representation learning

RESEARCHarXiv CS.CL·vor 15T

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Große Sprachmodelle (LLMs) zeigen konsistente Asymmetrien bei der Beratung zu religiösen Konversionen, indem sie einige Religionen wie Katholiken, Baháʼí und Sikhs bevorzugen, während sie andere wie Atheisten und Zeugen Jehovas subtil entmutigen. Diese Muster variieren je nach Modell und Anbieter, wobei Grok 4.20 die stärksten Asymmetrien aufweist, ermittelt durch ein Bewertungssystem, das LLMs als Richter einsetzte.

LLMs Religion faith AI ethics

RESEARCHarXiv CS.CL·4/22/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Diese Arbeit untersucht kontrafaktische Ungerechtigkeit in LLMs, indem sie beobachtet, wie sich ihre Reaktionen auf Humor ändern, wenn Sprecher- und Adressatenidentitäten getauscht werden. Experimente zeigen konsistente relationale Ungleichheiten: Witze von privilegierten Sprechern werden häufiger abgelehnt oder als bösartig eingestuft.

ethics social impact LLMs Bias

RESEARCHarXiv CS.CL·vor 27T

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Diese Forschung bewertet systematisch die Beziehung zwischen differenzieller Privatsphäre (DP) und sozialer Voreingenommenheit in großen Sprachmodellen (LLMs). Sie vergleicht ein DP-trainiertes LLM mit Nicht-DP-Baselines und stellt fest, dass DP die Voreingenommenheit bei Satzbewertungsaufgaben reduziert, dies jedoch nicht für alle Aufgaben gilt, und zeigt eine Diskrepanz zwischen Logit-Level- und Output-Level-Voreingenommenheit auf.

LLMs security AI ethics Bias

ARTICLEDEV.to AI·4/21/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

Der Artikel befasst sich mit der kritischen Herausforderung, die Zuverlässigkeit von KI-gestützter Forschung zu gewährleisten, bei der der Engpass nicht mehr der Informationszugang, sondern die Genauigkeit der KI-Ergebnisse ist. Er schlägt ein dreischichtiges Modell — Abruf-Integrität, Denk-Fidelität und Ausgabe-Verifizierbarkeit — zur Bewertung von KI-Tools in der Forschung vor.

Research methodology AI trustworthiness AI ethics AI evaluation

RESEARCHDEV.to AI·vor 26T

DPAA Debiases GNN Recommenders by Reweighting Message Passing

Das arXiv-Paper 2605.11145 stellt DPAA vor, ein Entzerrungsframework für GNN-basiertes kollaboratives Filtern, das adaptive Gewichtung während der Nachrichtenweitergabe anwendet. Es wirkt der Popularitätsverstärkung entgegen und übertrifft frühere Methoden auf realen Datensätzen.

recommender systems Graph Neural Networks machine learning Collaborative Filtering

ARTICLEDEV.to AI·5/1/2026

LLMs are Listening to How We Ask, Not What We Ask

Dieser Artikel bespricht eine Studie von Kumaran et al. aus dem Jahr 2026, die zwei kritische, asymmetrische Verzerrungen in LLMs aufzeigt: eine wahlunterstützende Verzerrung, bei der Modelle Vertrauen in frühere Antworten gewinnen, und eine Überempfindlichkeit gegenüber Widersprüchen. Diese Erkenntnisse sind für Entwickler, die auf LLMs aufbauen, von großer Bedeutung und beeinflussen, wie wir mit KI interagieren.

research-analysis LLMs AI reliability Bias

RESEARCHarXiv CS.CL·5/8/2026

The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation

Dieses Papier identifiziert und formalisiert das

AI models research RAG MLLMs

RESEARCHarXiv CS.CL·vor 19T

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Diese Studie schlägt ein strukturiertes Framework zur Verbesserung des LLM-Argumentationsvermögens bei der Analyse langer Dokumente vor, um kontextuelle Verzerrungen und Auslassungsfehler zu bekämpfen. Es kombiniert parallele abschnittsweise Verarbeitung mit evidenzbasierter Konsolidierung, um robustere und bias-resistentere konzeptuelle Abstraktionen zu erzeugen.

Contextual Reasoning natural language processing AI Research Bias

RESEARCHarXiv CS.CL·5/7/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Dieser Artikel bewertet Open-Weight- und domänenangepasste große Sprachmodelle (LLMs) für die Klassifizierung von Konfliktereignissen in Westafrika. Die Studie zeigt, dass Open-Weight-Modelle eine "Falsche Illegitimations"-Voreingenommenheit aufweisen, während domänenangepasste Modelle eine nahezu direktionale Neutralität erreichen, aber eine akteurbezogene Auswahlvoreingenommenheit beibehalten.

LLMs Model Evaluation Conflict Monitoring Humanitarian Accountability

RESEARCHarXiv CS.LG·vor 22T

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Diese Studie untersucht die Auswirkungen der Post-Training-Quantisierung auf die Qualität großer Sprachmodelle (LLMs) und zeigt, dass Komprimierung zur Entstehung von Voreingenommenheit führen kann. Eine 3-Bit-Quantisierung führte dazu, dass 6-21% der zuvor unvoreingenommenen Elemente neue stereotype Verhaltensweisen entwickelten, was ein klares Dosis-Wirkungs-Muster zeigte.

Model Compression LLMs quantization model quality

RESEARCHarXiv CS.CL·vor 14T

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Dieser Artikel stellt einen kausalen Rahmen zur Untersuchung von Rationalisierungsverzerrungen bei LLMs vor, die als automatische Juroren für Zusammenfassungs- und Dialogbewertungen eingesetzt werden. Er untersucht, ob die Bewertungen und Erklärungen von LLMs stabil bleiben, wenn nicht-evidente Hinweise gestört werden, und schlägt Hinweisinterventionen und Ankerkennzahlen vor.

LLMs evaluation AI rationalization

RESEARCHarXiv CS.LG·4/6/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

Homophily contrastive learning Graph Neural Networks machine learning