← heapsort-ai

Bias

22 items

ARTICLE↑ trendingHacker News (AI)·2d atrás

No Model Will Save Us: Pope Leo, the Miserostat, and AI's Woke Coders

Este artigo explora uma perspectiva crítica sobre a inteligência artificial, argumentando que os modelos atuais e seus desenvolvedores, particularmente em relação a questões de ética e viés, não serão a solução definitiva para os desafios que enfrentamos. Ele compara as preocupações modernas com a IA a conceitos históricos para analisar as limitações inerentes e as influências ideológicas na tecnologia.

49
ARTICLE↑ trendingHacker News (AI)·9d atrás

Border Cameras and Childhood: Why AI Age Estimation Fails Asylum Seekers

O artigo discute como a tecnologia de estimativa de idade por IA utilizada nas fronteiras frequentemente identifica erroneamente requerentes de asilo crianças como adultos, resultando em graves consequências para indivíduos vulneráveis. Ele destaca as falhas éticas e os preconceitos inerentes a esses sistemas, defendendo uma abordagem mais humana que priorize a segurança e o bem-estar das crianças em vez de avaliações algorítmicas falhas.

42
RESEARCHarXiv CS.CL·19d atrás

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Este artigo investiga como os Grandes Modelos de Linguagem (LLMs) representam a deficiência, simulando as perspectivas de indivíduos com deficiência na geração de posts de mídia social. Esses posts são então comparados com os escritos por pessoas reais com deficiência para analisar a perpetuação ou correção excessiva de preconceitos.

30
RESEARCHarXiv CS.CL·06/04/2026

SocioEval: A Template-Based Framework for Evaluating Socioeconomic Status Bias in Foundation Models

SocioEval é um framework baseado em templates para avaliar sistematicamente o viés de status socioeconômico em modelos de fundação, incluindo LLMs, uma área pouco explorada. A pesquisa avaliou 13 LLMs e revelou variações substanciais nas taxas de viés (0,42% a 33,75%), manifestando-se de forma diferente em vários temas.

29
RESEARCHarXiv CS.AI·27d atrás

Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs

Este artigo de pesquisa revela que âncoras numéricas em imagens sistematicamente distorcem os julgamentos de qualidade de Modelos de Visão-Linguagem (VLMs). A análise camada por camada mostra que as camadas ótimas para previsão de qualidade são mais profundas do que aquelas onde a classificação da âncora satura, estabelecendo uma explicação causal para o viés de ancoragem visual.

29
RESEARCHarXiv CS.CL·15d atrás

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

Modelos de linguagem grandes (LLMs) mostram vieses consistentes ao aconselhar sobre conversões religiosas, favorecendo algumas religiões como Católica, Baháʼí e Sikh, enquanto desencorajam outras como Ateus e Testemunhas de Jeová. Estas assimetrias variam entre modelos e fornecedores, com o Grok 4.20 exibindo o maior viés, descoberto através de um quadro de avaliação que usou LLMs como juízes.

28
RESEARCHarXiv CS.CL·27d atrás

How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation

Esta pesquisa avalia sistematicamente a relação entre privacidade diferencial (DP) e viés social em grandes modelos de linguagem (LLMs). O estudo compara um LLM treinado com DP a linhas de base sem DP, revelando que a DP reduz o viés em tarefas de pontuação de frases, mas essa melhoria não se generaliza para todas as tarefas, e há uma discrepância entre o viés em nível de logit e em nível de saída.

27
ARTICLEDEV.to AI·21/04/2026

Evaluating AI Tools for Research: A Framework for Accuracy, Bias, and Trustworthiness

O artigo discute o desafio crítico de garantir a confiabilidade na pesquisa assistida por IA, onde a questão não é mais o acesso à informação, mas a precisão dos resultados. Ele propõe um modelo de três camadas – integridade de recuperação, fidelidade de raciocínio e verificabilidade de saída – para avaliar ferramentas de IA em pesquisa.

27
ARTICLEDEV.to AI·01/05/2026

LLMs are Listening to How We Ask, Not What We Ask

Este artigo discute um estudo de 2026 de Kumaran et al. que revela dois vieses críticos e assimétricos em LLMs: um viés de apoio à escolha, onde os modelos ganham confiança em suas respostas anteriores, e hipersensibilidade à contradição. Essas descobertas têm implicações significativas para os desenvolvedores que trabalham com LLMs, impactando a forma como interagimos com a IA.

27
RESEARCHarXiv CS.CL·07/05/2026

Are LLMs Ready for Conflict Monitoring? Empirical Evidence from West Africa

Este artigo avalia modelos de linguagem grandes (LLMs) de código aberto e adaptados ao domínio para a classificação de eventos de conflito na África Ocidental. A pesquisa revela que modelos de código aberto demonstram um viés de "Ilegitimação Falsa", enquanto modelos adaptados ao domínio alcançam neutralidade direcional, mas mantêm um viés de seleção baseado em atores.

27
RESEARCHarXiv CS.LG·22d atrás

Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels

Este estudo investiga o impacto da quantização pós-treinamento na qualidade dos Grandes Modelos de Linguagem (LLMs), revelando que a compressão pode levar ao surgimento de vieses. A quantização de 3 bits fez com que 6-21% dos itens anteriormente imparciais desenvolvessem novos comportamentos estereotipados em modelos como Qwen2.5-7B, Mistral-7B e Phi-3.5-mini.

27
RESEARCHarXiv CS.CL·14d atrás

Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges

Este artigo introduz uma estrutura causal para estudar o viés de racionalização em LLMs usados como juízes automáticos para avaliação de resumos e diálogos. Ele investiga se as classificações e explicações dos LLMs permanecem estáveis quando pistas não-evidenciais são perturbadas, propondo intervenções de pistas e métricas de ancoragem.

27
RESEARCHarXiv CS.LG·06/04/2026

Homophily-aware Supervised Contrastive Counterfactual Augmented Fair Graph Neural Network

Este trabalho propõe um novo modelo para treinar Redes Neurais Gráficas (GNNs) sensíveis à justiça, aprimorando o framework CAF. A abordagem utiliza uma estratégia de treinamento em duas fases, editando o grafo para ajustar a homofilia e integrando perdas contrastivas e ambientais modificadas para melhorar a predição e a justiça.

27