← heapsort-ai

Bias

22 items

RESEARCHarXiv CS.AI·hace 1d

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

Este estudio formaliza el sesgo en sistemas de aprendizaje automático como una operación de ruptura de simetría, definiendo la equidad como la invariancia al cambiar atributos sensibles contrafactuales. Implementa la regularización basada en pérdidas para restaurar la simetría, logrando más del 90% de reducción de violación de sesgo con un costo de precisión de alrededor del 5%.

55
ARTICLE↑ trendingHacker News (AI)·hace 2d

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Este artículo explora una perspectiva crítica sobre la inteligencia artificial, argumentando que los modelos actuales y sus desarrolladores, especialmente en relación con la ética y el sesgo, no serán la solución definitiva a los desafíos que enfrentamos. Compara las preocupaciones modernas con la IA con conceptos históricos para analizar las limitaciones inherentes y las influencias ideológicas en la tecnología.

52
ARTICLE↑ trendingHacker News (AI)·hace 8d

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

El artículo analiza cómo la tecnología de estimación de edad por IA utilizada en las fronteras a menudo identifica erróneamente a los solicitantes de asilo menores como adultos, lo que conlleva graves consecuencias para personas vulnerables. Destaca los fallos éticos y los sesgos inherentes a estos sistemas, abogando por un enfoque más humano que priorice la seguridad y el bienestar de los niños sobre las evaluaciones algorítmicas defectuosas.

42
RESEARCHarXiv CS.CL·hace 19d

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Este artículo investiga cómo los Grandes Modelos de Lenguaje (LLMs) representan la discapacidad simulando las perspectivas de individuos con discapacidad en la generación de publicaciones en redes sociales. Luego, estas publicaciones se comparan con las escritas por personas reales con discapacidad para analizar la perpetuación o corrección excesiva de sesgos.

30
RESEARCHarXiv CS.CL·6/4/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

29
RESEARCHarXiv CS.AI·hace 27d

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Este artículo de investigación muestra que los anclajes numéricos incrustados en las imágenes sesgan sistemáticamente los juicios de calidad de los Modelos de Visión-Lenguaje (VLMs). El sondeo capa por capa revela que las capas óptimas para la predicción de calidad son más profundas que donde satura la clasificación del anclaje, estableciendo una explicación causal del sesgo de anclaje visual.

29
RESEARCHarXiv CS.CL·hace 15d

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Los grandes modelos de lenguaje (LLMs) muestran asimetrías consistentes al asesorar sobre conversiones religiosas, favoreciendo algunas religiones como la Católica, Baháʼí y Sikh, y desfavoreciendo sutilmente a otras como Ateos y Testigos de Jehová. Estos patrones varían según el modelo y el proveedor, con Grok 4.20 exhibiendo las asimetrías más fuertes, identificadas mediante un marco de evaluación con LLMs como jueces.

28
RESEARCHarXiv CS.CL·hace 27d

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Esta investigación evalúa sistemáticamente la relación entre la privacidad diferencial (DP) y el sesgo social en grandes modelos de lenguaje (LLM). Compara un LLM entrenado con DP con líneas base sin DP en varias tareas, encontrando que la DP reduce el sesgo en tareas de puntuación de oraciones, pero no de forma universal, y revela una discrepancia entre el sesgo a nivel de logit y a nivel de salida.

27
ARTICLEDEV.to AI·21/4/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

El artículo aborda el desafío crítico de garantizar la fiabilidad en la investigación asistida por IA, donde el cuello de botella ya no es el acceso a la información, sino la precisión de los resultados de la IA. Propone un modelo de tres capas —integridad de recuperación, fidelidad de razonamiento y verificabilidad de la salida— para evaluar las herramientas de IA en la investigación.

27
ARTICLEDEV.to AI·1/5/2026

LLMs are Listening to How We Ask, Not What We Ask

Este artículo analiza un estudio de 2026 de Kumaran et al. que identifica dos sesgos asimétricos críticos en los LLM: un sesgo de apoyo a la elección donde los modelos ganan confianza en sus respuestas anteriores y una hipersensibilidad a la contradicción. Estos hallazgos tienen implicaciones significativas para los desarrolladores que construyen sobre LLM, afectando la interacción con la IA.

27
RESEARCHarXiv CS.CL·hace 19d

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Este estudio propone un marco estructurado para mejorar el razonamiento de los LLM al analizar documentos extensos, abordando el sesgo contextual y los errores de omisión. Combina el procesamiento paralelo a nivel de fragmento con la consolidación anclada en evidencia para generar abstracciones conceptuales más robustas y resistentes al sesgo.

27
RESEARCHarXiv CS.CL·7/5/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Este artículo evalúa modelos de lenguaje grandes (LLMs) de código abierto y adaptados al dominio para la clasificación de eventos de conflicto en África Occidental. La investigación revela que los modelos de código abierto exhiben un sesgo de "Ilegitimación Falsa", mientras que los modelos adaptados al dominio logran neutralidad direccional pero mantienen un sesgo de selección basado en actores.

27
RESEARCHarXiv CS.LG·hace 22d

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Este estudio investiga el impacto de la cuantificación post-entrenamiento en la calidad de los Grandes Modelos de Lenguaje (LLMs), revelando que la compresión puede llevar a la aparición de sesgos. La cuantificación de 3 bits hizo que entre el 6% y el 21% de los elementos previamente imparciales desarrollaran nuevos comportamientos estereotipados en modelos como Qwen2.5-7B, Mistral-7B y Phi-3.5-mini.

27
RESEARCHarXiv CS.CL·hace 14d

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Este artículo presenta un marco causal para estudiar el sesgo de racionalización en LLMs utilizados como jueces automáticos para la evaluación de resúmenes y diálogos. Investiga si las clasificaciones y explicaciones de los LLMs permanecen estables cuando se perturban las señales no evidenciales, proponiendo intervenciones de señales y métricas de anclaje.

27
RESEARCHarXiv CS.LG·6/4/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

27