Bias

22 items

RESEARCHarXiv CS.AI·1d atrás

Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation

O artigo formaliza o viés em sistemas de aprendizado de máquina como uma quebra de simetria, propondo a equidade como invariância sob a troca de atributos sensíveis. O framework usa regularização baseada em perdas para restaurar a simetria, reduzindo a violação de viés em mais de 90% com custo de precisão de cerca de 5%.

Symmetry machine learning AI ethics Bias

ARTICLE↑ trendingHacker News (AI)·2d atrás

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Este artigo explora uma perspectiva crítica sobre a inteligência artificial, argumentando que os modelos atuais e seus desenvolvedores, particularmente em relação a questões de ética e viés, não serão a solução definitiva para os desafios que enfrentamos. Ele compara as preocupações modernas com a IA a conceitos históricos para analisar as limitações inerentes e as influências ideológicas na tecnologia.

Societal impact AI philosophy AI ethics AI development

ARTICLE↑ trendingHacker News (AI)·9d atrás

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

O artigo discute como a tecnologia de estimativa de idade por IA utilizada nas fronteiras frequentemente identifica erroneamente requerentes de asilo crianças como adultos, resultando em graves consequências para indivíduos vulneráveis. Ele destaca as falhas éticas e os preconceitos inerentes a esses sistemas, defendendo uma abordagem mais humana que priorize a segurança e o bem-estar das crianças em vez de avaliações algorítmicas falhas.

Human rights AI ethics Facial recognition Immigration

ARTICLE↑ trendingHacker News (AI)·14d atrás

AI chatbots show bias toward Catholicism, researchers say

Pesquisadores afirmam que chatbots de IA, como Claude e ChatGPT, demonstram um viés em relação ao catolicismo. Essa observação levanta questões sobre a neutralidade e os preconceitos inerentes aos modelos de linguagem avançados.

ethics AI chatbots Religion Bias

RESEARCHarXiv CS.CL·19d atrás

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Este artigo investiga como os Grandes Modelos de Linguagem (LLMs) representam a deficiência, simulando as perspectivas de indivíduos com deficiência na geração de posts de mídia social. Esses posts são então comparados com os escritos por pessoas reais com deficiência para analisar a perpetuação ou correção excessiva de preconceitos.

LLMs disability representation social media

RESEARCHarXiv CS.CL·06/04/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

LLMs evaluation Foundation Models SocioEval

RESEARCHarXiv CS.AI·27d atrás

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Este artigo de pesquisa revela que âncoras numéricas em imagens sistematicamente distorcem os julgamentos de qualidade de Modelos de Visão-Linguagem (VLMs). A análise camada por camada mostra que as camadas ótimas para previsão de qualidade são mais profundas do que aquelas onde a classificação da âncora satura, estabelecendo uma explicação causal para o viés de ancoragem visual.

neural networks Vision-Language Models Model Evaluation representation learning

RESEARCHarXiv CS.CL·15d atrás

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Modelos de linguagem grandes (LLMs) mostram vieses consistentes ao aconselhar sobre conversões religiosas, favorecendo algumas religiões como Católica, Baháʼí e Sikh, enquanto desencorajam outras como Ateus e Testemunhas de Jeová. Estas assimetrias variam entre modelos e fornecedores, com o Grok 4.20 exibindo o maior viés, descoberto através de um quadro de avaliação que usou LLMs como juízes.

LLMs Religion faith AI ethics

RESEARCHarXiv CS.CL·22/04/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Este artigo investiga a injustiça contrafactual em LLMs, analisando como suas respostas ao humor mudam ao trocar identidades de falantes e ouvintes. A pesquisa revela disparidades relacionais consistentes, onde piadas contadas por falantes privilegiados são recusadas com mais frequência ou consideradas maliciosas pelos modelos.

ethics social impact LLMs Bias

RESEARCHarXiv CS.CL·27d atrás

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Esta pesquisa avalia sistematicamente a relação entre privacidade diferencial (DP) e viés social em grandes modelos de linguagem (LLMs). O estudo compara um LLM treinado com DP a linhas de base sem DP, revelando que a DP reduz o viés em tarefas de pontuação de frases, mas essa melhoria não se generaliza para todas as tarefas, e há uma discrepância entre o viés em nível de logit e em nível de saída.

LLMs security AI ethics Bias

ARTICLEDEV.to AI·21/04/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

O artigo discute o desafio crítico de garantir a confiabilidade na pesquisa assistida por IA, onde a questão não é mais o acesso à informação, mas a precisão dos resultados. Ele propõe um modelo de três camadas – integridade de recuperação, fidelidade de raciocínio e verificabilidade de saída – para avaliar ferramentas de IA em pesquisa.

Research methodology AI trustworthiness AI ethics AI evaluation

RESEARCHDEV.to AI·26d atrás

DPAA Debiases GNN Recommenders by Reweighting Message Passing

O artigo arXiv 2605.11145 propõe DPAA, um framework de desenviesamento para filtragem colaborativa baseada em GNNs que aplica pesos adaptativos na passagem de mensagens. Ele combate a amplificação da popularidade e supera métodos anteriores em conjuntos de dados reais.

recommender systems Graph Neural Networks machine learning Collaborative Filtering

ARTICLEDEV.to AI·01/05/2026

LLMs are Listening to How We Ask, Not What We Ask

Este artigo discute um estudo de 2026 de Kumaran et al. que revela dois vieses críticos e assimétricos em LLMs: um viés de apoio à escolha, onde os modelos ganham confiança em suas respostas anteriores, e hipersensibilidade à contradição. Essas descobertas têm implicações significativas para os desenvolvedores que trabalham com LLMs, impactando a forma como interagimos com a IA.

research-analysis LLMs AI reliability Bias

RESEARCHarXiv CS.CL·08/05/2026

The Cost of Context: Mitigating Textual Bias in Multimodal Retrieval-Augmented Generation

Este artigo identifica e formaliza a

AI models research RAG MLLMs

RESEARCHarXiv CS.CL·19d atrás

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

O estudo propõe uma estrutura para aprimorar o raciocínio de LLMs na análise de documentos longos, combatendo vieses contextuais e erros de omissão. Ele combina processamento paralelo de chunks com consolidação ancorada em evidências para abstrações conceituais mais robustas e resilientes a vieses.

Contextual Reasoning Natural Language Processing AI Research Bias

RESEARCHarXiv CS.CL·07/05/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Este artigo avalia modelos de linguagem grandes (LLMs) de código aberto e adaptados ao domínio para a classificação de eventos de conflito na África Ocidental. A pesquisa revela que modelos de código aberto demonstram um viés de "Ilegitimação Falsa", enquanto modelos adaptados ao domínio alcançam neutralidade direcional, mas mantêm um viés de seleção baseado em atores.

LLMs Model Evaluation Conflict Monitoring Humanitarian Accountability

RESEARCHarXiv CS.LG·22d atrás

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Este estudo investiga o impacto da quantização pós-treinamento na qualidade dos Grandes Modelos de Linguagem (LLMs), revelando que a compressão pode levar ao surgimento de vieses. A quantização de 3 bits fez com que 6-21% dos itens anteriormente imparciais desenvolvessem novos comportamentos estereotipados em modelos como Qwen2.5-7B, Mistral-7B e Phi-3.5-mini.

Model Compression LLMs quantization model quality

RESEARCHarXiv CS.CL·14d atrás

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Este artigo introduz uma estrutura causal para estudar o viés de racionalização em LLMs usados como juízes automáticos para avaliação de resumos e diálogos. Ele investiga se as classificações e explicações dos LLMs permanecem estáveis quando pistas não-evidenciais são perturbadas, propondo intervenções de pistas e métricas de ancoragem.

LLMs evaluation AI rationalization

RESEARCHarXiv CS.CL·6d atrás

Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers

Este estudo investiga como o contexto conversacional afeta as respostas de LLMs, especialmente em cenários de alto risco. Ele demonstra que tópicos de conversa são os principais preditores das orientações geradas por LLMs, impactando disparidades de resultados.

conversational context LLMs linguistic features sociodemographics

RESEARCHarXiv CS.LG·06/04/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

Homophily contrastive learning Graph Neural Networks machine learning