← heapsort-ai

Bias

22 items

RESEARCHarXiv CS.AI·vor 1T

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Diese Forschung formalisiert Voreingenommenheit in maschinellen Lernsystemen als Symmetriebrechung und definiert Fairness als Invarianz unter dem kontrafaktischen Wechsel sensibler Attribute. Sie implementiert verlustbasierte Regularisierung zur Wiederherstellung der Symmetrie und erreicht über 90% Reduktion von Voreingenommenheitsverletzungen mit etwa 5% Genauigkeitskosten.

55
ARTICLE↑ trendingHacker News (AI)·vor 2T

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Dieser Artikel beleuchtet eine kritische Perspektive auf künstliche Intelligenz und argumentiert, dass aktuelle Modelle und ihre Entwickler, insbesondere in Bezug auf Ethik und Voreingenommenheit, nicht die endgültige Lösung für unsere Herausforderungen sein werden. Er zieht Parallelen zu historischen Konzepten, um die inhärenten Grenzen und ideologischen Einflüsse in der KI-Technologie zu analysieren.

52
ARTICLE↑ trendingHacker News (AI)·vor 8T

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

Der Artikel erörtert, wie KI-Altersätzungstechnologien an Grenzen oft fälschlicherweise kindliche Asylsuchende als Erwachsene identifizieren, was schwerwiegende Folgen für schutzbedürftige Personen hat. Er beleuchtet die ethischen Mängel und inhärenten Vorurteile dieser Systeme und plädiert für einen humaneren Ansatz, der die Sicherheit und das Wohlergehen von Kindern über fehlerhafte algorithmische Bewertungen stellt.

42
RESEARCHarXiv CS.CL·vor 19T

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Dieses Papier untersucht, wie große Sprachmodelle (LLMs) Behinderung darstellen, indem sie die Perspektiven von Menschen mit Behinderungen bei der Erstellung von Social-Media-Beiträgen simulieren. Diese Beiträge werden dann mit denen von echten Menschen mit Behinderungen verglichen, um die Perpetuierung oder Überkorrektur von Vorurteilen zu analysieren.

30
RESEARCHarXiv CS.CL·4/6/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

29
RESEARCHarXiv CS.AI·vor 27T

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Diese Forschungsarbeit zeigt, dass eingebettete numerische Anker auf Bildern systematisch die Qualitätsurteile von Vision-Language-Modellen (VLMs) verzerren. Schichtweise Sondierungen offenbaren, dass optimale Schichten für die Qualitätsprognose tiefer liegen als jene, in denen die Ankerklassifizierung sättigt, was eine kausale Erklärung für die visuelle Verankerungsverzerrung liefert.

29
RESEARCHarXiv CS.CL·vor 15T

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Große Sprachmodelle (LLMs) zeigen konsistente Asymmetrien bei der Beratung zu religiösen Konversionen, indem sie einige Religionen wie Katholiken, Baháʼí und Sikhs bevorzugen, während sie andere wie Atheisten und Zeugen Jehovas subtil entmutigen. Diese Muster variieren je nach Modell und Anbieter, wobei Grok 4.20 die stärksten Asymmetrien aufweist, ermittelt durch ein Bewertungssystem, das LLMs als Richter einsetzte.

28
RESEARCHarXiv CS.CL·vor 27T

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Diese Forschung bewertet systematisch die Beziehung zwischen differenzieller Privatsphäre (DP) und sozialer Voreingenommenheit in großen Sprachmodellen (LLMs). Sie vergleicht ein DP-trainiertes LLM mit Nicht-DP-Baselines und stellt fest, dass DP die Voreingenommenheit bei Satzbewertungsaufgaben reduziert, dies jedoch nicht für alle Aufgaben gilt, und zeigt eine Diskrepanz zwischen Logit-Level- und Output-Level-Voreingenommenheit auf.

27
ARTICLEDEV.to AI·4/21/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

Der Artikel befasst sich mit der kritischen Herausforderung, die Zuverlässigkeit von KI-gestützter Forschung zu gewährleisten, bei der der Engpass nicht mehr der Informationszugang, sondern die Genauigkeit der KI-Ergebnisse ist. Er schlägt ein dreischichtiges Modell — Abruf-Integrität, Denk-Fidelität und Ausgabe-Verifizierbarkeit — zur Bewertung von KI-Tools in der Forschung vor.

27
ARTICLEDEV.to AI·5/1/2026

LLMs are Listening to How We Ask, Not What We Ask

Dieser Artikel bespricht eine Studie von Kumaran et al. aus dem Jahr 2026, die zwei kritische, asymmetrische Verzerrungen in LLMs aufzeigt: eine wahlunterstützende Verzerrung, bei der Modelle Vertrauen in frühere Antworten gewinnen, und eine Überempfindlichkeit gegenüber Widersprüchen. Diese Erkenntnisse sind für Entwickler, die auf LLMs aufbauen, von großer Bedeutung und beeinflussen, wie wir mit KI interagieren.

27
RESEARCHarXiv CS.CL·vor 19T

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Diese Studie schlägt ein strukturiertes Framework zur Verbesserung des LLM-Argumentationsvermögens bei der Analyse langer Dokumente vor, um kontextuelle Verzerrungen und Auslassungsfehler zu bekämpfen. Es kombiniert parallele abschnittsweise Verarbeitung mit evidenzbasierter Konsolidierung, um robustere und bias-resistentere konzeptuelle Abstraktionen zu erzeugen.

27
RESEARCHarXiv CS.CL·5/7/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Dieser Artikel bewertet Open-Weight- und domänenangepasste große Sprachmodelle (LLMs) für die Klassifizierung von Konfliktereignissen in Westafrika. Die Studie zeigt, dass Open-Weight-Modelle eine "Falsche Illegitimations"-Voreingenommenheit aufweisen, während domänenangepasste Modelle eine nahezu direktionale Neutralität erreichen, aber eine akteurbezogene Auswahlvoreingenommenheit beibehalten.

27
RESEARCHarXiv CS.LG·vor 22T

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Diese Studie untersucht die Auswirkungen der Post-Training-Quantisierung auf die Qualität großer Sprachmodelle (LLMs) und zeigt, dass Komprimierung zur Entstehung von Voreingenommenheit führen kann. Eine 3-Bit-Quantisierung führte dazu, dass 6-21% der zuvor unvoreingenommenen Elemente neue stereotype Verhaltensweisen entwickelten, was ein klares Dosis-Wirkungs-Muster zeigte.

27
RESEARCHarXiv CS.CL·vor 14T

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Dieser Artikel stellt einen kausalen Rahmen zur Untersuchung von Rationalisierungsverzerrungen bei LLMs vor, die als automatische Juroren für Zusammenfassungs- und Dialogbewertungen eingesetzt werden. Er untersucht, ob die Bewertungen und Erklärungen von LLMs stabil bleiben, wenn nicht-evidente Hinweise gestört werden, und schlägt Hinweisinterventionen und Ankerkennzahlen vor.

27
RESEARCHarXiv CS.LG·4/6/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

27