Bias

22 items

RESEARCHarXiv CS.AI·hace 1d

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Este estudio formaliza el sesgo en sistemas de aprendizaje automático como una operación de ruptura de simetría, definiendo la equidad como la invariancia al cambiar atributos sensibles contrafactuales. Implementa la regularización basada en pérdidas para restaurar la simetría, logrando más del 90% de reducción de violación de sesgo con un costo de precisión de alrededor del 5%.

Symmetry machine learning AI ethics Bias

ARTICLE↑ trendingHacker News (AI)·hace 2d

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Este artículo explora una perspectiva crítica sobre la inteligencia artificial, argumentando que los modelos actuales y sus desarrolladores, especialmente en relación con la ética y el sesgo, no serán la solución definitiva a los desafíos que enfrentamos. Compara las preocupaciones modernas con la IA con conceptos históricos para analizar las limitaciones inherentes y las influencias ideológicas en la tecnología.

Societal impact AI philosophy AI ethics AI development

ARTICLE↑ trendingHacker News (AI)·hace 8d

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

El artículo analiza cómo la tecnología de estimación de edad por IA utilizada en las fronteras a menudo identifica erróneamente a los solicitantes de asilo menores como adultos, lo que conlleva graves consecuencias para personas vulnerables. Destaca los fallos éticos y los sesgos inherentes a estos sistemas, abogando por un enfoque más humano que priorice la seguridad y el bienestar de los niños sobre las evaluaciones algorítmicas defectuosas.

Human rights AI ethics Facial recognition Immigration

ARTICLE↑ trendingHacker News (AI)·hace 14d

AI chatbots show bias toward Catholicism, researchers say

Investigadores afirman que los chatbots de IA, como Claude y ChatGPT, demuestran un sesgo hacia el catolicismo. Esta observación plantea interrogantes sobre la neutralidad y los prejuicios inherentes a los modelos de lenguaje avanzados.

ethics AI chatbots Religion Bias

RESEARCHarXiv CS.CL·hace 19d

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Este artículo investiga cómo los Grandes Modelos de Lenguaje (LLMs) representan la discapacidad simulando las perspectivas de individuos con discapacidad en la generación de publicaciones en redes sociales. Luego, estas publicaciones se comparan con las escritas por personas reales con discapacidad para analizar la perpetuación o corrección excesiva de sesgos.

LLMs disability representation social media

RESEARCHarXiv CS.CL·hace 6d

Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers

Este estudio investiga cómo el contexto conversacional afecta las respuestas de los LLM, especialmente en escenarios de alto riesgo. Demuestra que los temas de conversación son los principales predictores de los consejos generados por los LLM, influyendo en las disparidades de resultados.

conversational context LLMs linguistic features sociodemographics

RESEARCHarXiv CS.CL·6/4/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

LLMs evaluation Foundation Models SocioEval

RESEARCHarXiv CS.AI·hace 27d

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Este artículo de investigación muestra que los anclajes numéricos incrustados en las imágenes sesgan sistemáticamente los juicios de calidad de los Modelos de Visión-Lenguaje (VLMs). El sondeo capa por capa revela que las capas óptimas para la predicción de calidad son más profundas que donde satura la clasificación del anclaje, estableciendo una explicación causal del sesgo de anclaje visual.

neural networks Vision-Language Models Model Evaluation representation learning

RESEARCHarXiv CS.CL·hace 15d

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Los grandes modelos de lenguaje (LLMs) muestran asimetrías consistentes al asesorar sobre conversiones religiosas, favoreciendo algunas religiones como la Católica, Baháʼí y Sikh, y desfavoreciendo sutilmente a otras como Ateos y Testigos de Jehová. Estos patrones varían según el modelo y el proveedor, con Grok 4.20 exhibiendo las asimetrías más fuertes, identificadas mediante un marco de evaluación con LLMs como jueces.

LLMs Religion faith AI ethics

RESEARCHarXiv CS.CL·22/4/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Este trabajo investiga la injusticia contrafactual en LLMs, observando cómo sus respuestas al humor cambian al intercambiar las identidades del hablante y del oyente. Los experimentos revelan disparidades relacionales consistentes, donde los chistes contados por hablantes privilegiados son rechazados o juzgados como maliciosos con mayor frecuencia.

ethics social impact LLMs Bias

RESEARCHarXiv CS.CL·hace 27d

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Esta investigación evalúa sistemáticamente la relación entre la privacidad diferencial (DP) y el sesgo social en grandes modelos de lenguaje (LLM). Compara un LLM entrenado con DP con líneas base sin DP en varias tareas, encontrando que la DP reduce el sesgo en tareas de puntuación de oraciones, pero no de forma universal, y revela una discrepancia entre el sesgo a nivel de logit y a nivel de salida.

LLMs security AI ethics Bias

ARTICLEDEV.to AI·21/4/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

El artículo aborda el desafío crítico de garantizar la fiabilidad en la investigación asistida por IA, donde el cuello de botella ya no es el acceso a la información, sino la precisión de los resultados de la IA. Propone un modelo de tres capas —integridad de recuperación, fidelidad de razonamiento y verificabilidad de la salida— para evaluar las herramientas de IA en la investigación.

Research methodology AI trustworthiness AI ethics AI evaluation

RESEARCHDEV.to AI·hace 26d

DPAA Debiases GNN Recommenders by Reweighting Message Passing

El artículo arXiv 2605.11145 presenta DPAA, un marco de despolarización para el filtrado colaborativo basado en GNN que aplica ponderación adaptativa durante el paso de mensajes. Combate la amplificación de la popularidad y supera los métodos anteriores en conjuntos de datos reales.

recommender systems Graph Neural Networks machine learning Collaborative Filtering

ARTICLEDEV.to AI·1/5/2026

LLMs are Listening to How We Ask, Not What We Ask

Este artículo analiza un estudio de 2026 de Kumaran et al. que identifica dos sesgos asimétricos críticos en los LLM: un sesgo de apoyo a la elección donde los modelos ganan confianza en sus respuestas anteriores y una hipersensibilidad a la contradicción. Estos hallazgos tienen implicaciones significativas para los desarrolladores que construyen sobre LLM, afectando la interacción con la IA.

research-analysis LLMs AI reliability Bias

RESEARCHarXiv CS.CL·8/5/2026

The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation

Este artículo identifica y formaliza el

AI models research RAG MLLMs

RESEARCHarXiv CS.CL·hace 19d

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Este estudio propone un marco estructurado para mejorar el razonamiento de los LLM al analizar documentos extensos, abordando el sesgo contextual y los errores de omisión. Combina el procesamiento paralelo a nivel de fragmento con la consolidación anclada en evidencia para generar abstracciones conceptuales más robustas y resistentes al sesgo.

Contextual Reasoning natural language processing AI Research Bias

RESEARCHarXiv CS.CL·7/5/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Este artículo evalúa modelos de lenguaje grandes (LLMs) de código abierto y adaptados al dominio para la clasificación de eventos de conflicto en África Occidental. La investigación revela que los modelos de código abierto exhiben un sesgo de "Ilegitimación Falsa", mientras que los modelos adaptados al dominio logran neutralidad direccional pero mantienen un sesgo de selección basado en actores.

LLMs Model Evaluation Conflict Monitoring Humanitarian Accountability

RESEARCHarXiv CS.LG·hace 22d

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Este estudio investiga el impacto de la cuantificación post-entrenamiento en la calidad de los Grandes Modelos de Lenguaje (LLMs), revelando que la compresión puede llevar a la aparición de sesgos. La cuantificación de 3 bits hizo que entre el 6% y el 21% de los elementos previamente imparciales desarrollaran nuevos comportamientos estereotipados en modelos como Qwen2.5-7B, Mistral-7B y Phi-3.5-mini.

Model Compression LLMs quantization model quality

RESEARCHarXiv CS.CL·hace 14d

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Este artículo presenta un marco causal para estudiar el sesgo de racionalización en LLMs utilizados como jueces automáticos para la evaluación de resúmenes y diálogos. Investiga si las clasificaciones y explicaciones de los LLMs permanecen estables cuando se perturban las señales no evidenciales, proponiendo intervenciones de señales y métricas de anclaje.

LLMs evaluation AI rationalization

RESEARCHarXiv CS.LG·6/4/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

Homophily contrastive learning Graph Neural Networks machine learning