← heapsort-ai

AI bias

11 items

ARTICLEDEV.to AI·il y a 2j

Day 49: The Unseen Layers of Building Health AI for 22+ Indian Languages

Les LLM actuels comme GPT-4 peinent avec les requêtes médicales nuancées dans les langues indiennes en raison d'un biais fondamental dans leurs données d'entraînement, fortement orientées vers l'anglais. GoDavaii vise à combler cette lacune en développant une IA de Santé avancée pour plus de 22 langues indiennes, en se concentrant sur la pertinence contextuelle et l'accessibilité des connaissances médicales dans divers contextes linguistiques.

34
RESEARCHarXiv CS.AI·il y a 29j

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Une nouvelle recherche indique que le biais de position dans les modèles de raisonnement, tels que Chain-of-thought, augmente avec la longueur de la trajectoire de raisonnement. Cet effet a été observé dans diverses configurations de modèles et benchmarks, suggérant que « penser davantage » peut exacerber certains biais.

27
ARTICLEDEV.to AI·02/05/2026

The Aunty Test - what Marathi-speaking patients see when they ask Health AI in their own language

Cet article souligne comment la plupart des IA de santé, conçues en anglais, échouent à gérer les requêtes médicales dans des langues locales comme le marathi. Il insiste sur la nécessité d'IA qui raisonnent nativement dans plusieurs langues pour fournir des conseils précis, par opposition aux approches de traduction ou de "vernissage" localisé.

27
ARTICLEDEV.to AI·25/04/2026

Fairness in Child Safety AI: Why Demographic Parity Audits Are Not Optional

Cet article affirme que l'évaluation de l'équité, notamment la parité démographique, est une contrainte de déploiement critique et non négociable pour les systèmes d'IA dans la sécurité des enfants. Ignorer cette question cause des préjudices aux utilisateurs, des risques juridiques et une perte de confiance, tout en manquant des menaces dans les groupes sous-représentés à cause de données biaisées.

27
RESEARCHarXiv CS.CL·05/05/2026

Compared to What? Baselines and Metrics for Counterfactual Prompting

Ce travail soutient que les effets observés du "prompting contrefactuel" dans les LLM ne peuvent être attribués à un facteur ciblé sans tenir compte des modifications de texte préservant le sens qui établissent la sensibilité générale du modèle. La recherche montre que les taux d'inversion de prédiction lors du changement chirurgical du sexe du patient sont statistiquement indiscernables des taux induits par de simples paraphrases, suggérant qu'une sensibilité particulière au sexe du patient ne peut être conclue.

27
RESEARCHarXiv CS.CL·il y a 8j

Your Multimodal Speech Model Says I Have a Face for Radio

Cet article propose la première évaluation des biais dans la reconnaissance vocale multimodale, mettant en évidence des différences significatives de qualité de service entre les modèles mWhisper-Flamingo et Gemini, basées sur le genre et l'ethnie autodéclarés. Ces résultats soulignent la nécessité pour les développeurs d'évaluer, de corriger et de communiquer ces biais.

27
ARTICLEDEV.to AI·il y a 12j

What if AI Rejected Your Code Wrongly?

L'article examine les biais cachés dans les outils de révision de code automatisés par l'IA, remettant en question leur objectivité supposée. Il souligne la crainte que l'IA puisse rejeter à tort du code optimisé en raison de biais inhérents plutôt que d'une inefficacité réelle, impactant la productivité des développeurs.

21