← heapsort-ai

cognitive bias

5 items

ARTICLEDEV.to AI·4/17/2026

Projection 2.0: How We Attribute Personality, Gender, and Intent to Models Based on Tiny Prompt Variations

„Projektion 2.0“ beschreibt die menschliche Tendenz, KI-Systemen Persönlichkeit, Geschlecht und Absicht zuzuschreiben, basierend auf winzigen Unterschieden in der Anrede. Dieser Artikel untersucht diese faszinierende Eigenheit der menschlichen Psychologie, ihre Auswirkungen auf KI-Design und -Ethik sowie die Wichtigkeit, sich eigener Projektionen bewusster zu werden.

27
RESEARCHarXiv CS.CL·4/15/2026

Narrative over Numbers: The Identifiable Victim Effect and its Amplification Under Alignment and Reasoning in Large Language Models

Diese Forschung untersucht systematisch den Identifizierbare-Opfer-Effekt (IVE) in Großen Sprachmodellen, eine kognitive Verzerrung, bei der spezifische, narrativ beschriebene Opfer mehr Ressourcen erhalten als statistisch charakterisierte Gruppen. Die groß angelegte empirische Studie über 16 führende LLMs stellt fest, ob diese Systeme menschliche affektive Irrationalitäten in kritischen Anwendungen wie humanitärem Triage und Inhaltsmoderation erben.

27
ARTICLEDEV.to AI·vor 28T

赛仑

Dieser Artikel verwendet die Metapher der "Sirenen", um zu analysieren, wie moderne Algorithmen und die Aufmerksamkeitsökonomie kognitive Verzerrungen ausnutzen und "Aufmerksamkeits-Schwarzlöcher" schaffen. Er bietet Strategien für Individuen, diesen digitalen Fallen zu widerstehen, wie kognitive Dezentralisierung und Informationsminimalismus.

27
RESEARCHarXiv CS.CL·4/6/2026

Failing to Falsify: Evaluating and Mitigating Confirmation Bias in Language Models

Este estudo investiga o viés de confirmação em grandes modelos de linguagem (LLMs) usando uma tarefa de descoberta de regras, revelando que os LLMs exibem essa tendência, o que retarda a descoberta de regras ocultas. Ele demonstra que estratégias de intervenção, como o uso de prompts específicos, podem consistentemente diminuir esse viés.

27