← heapsort-ai

cognitive bias

5 items

ARTICLEDEV.to AI·17/04/2026

Projection 2.0: How We Attribute Personality, Gender, and Intent to Models Based on Tiny Prompt Variations

La « Projection 2.0 » décrit la tendance humaine à attribuer personnalité, genre et intention aux systèmes d'IA en fonction de minuscules variations dans la façon dont nous les interpellons. Cet article explore cette particularité psychologique, ses implications pour la conception et l'éthique de l'IA, et l'importance de prendre conscience de nos propres projections.

27
RESEARCHarXiv CS.CL·15/04/2026

Narrative over Numbers: The Identifiable Victim Effect and its Amplification Under Alignment and Reasoning in Large Language Models

Cette recherche examine systématiquement l'Effet de la Victime Identifiable (EVI) dans les grands modèles linguistiques, un biais cognitif où les victimes décrites narrativement reçoivent plus de ressources que les groupes statistiques. L'étude empirique à grande échelle sur 16 LLM de pointe évalue si ces systèmes héritent des irrationalités affectives humaines dans des applications critiques comme le triage humanitaire et la modération de contenu.

27
ARTICLEDEV.to AI·il y a 28j

赛仑

Cet article utilise la métaphore des "Sirènes" pour analyser comment les algorithmes modernes et l'économie de l'attention exploitent les biais cognitifs, créant des "trous noirs d'attention". Il propose des stratégies pour que les individus résistent à ces pièges numériques, telles que la décentralisation cognitive et le minimalisme informationnel.

27
RESEARCHarXiv CS.CL·06/04/2026

Failing to Falsify: Evaluating and Mitigating Confirmation Bias in Language Models

Este estudo investiga o viés de confirmação em grandes modelos de linguagem (LLMs) usando uma tarefa de descoberta de regras, revelando que os LLMs exibem essa tendência, o que retarda a descoberta de regras ocultas. Ele demonstra que estratégias de intervenção, como o uso de prompts específicos, podem consistentemente diminuir esse viés.

27