← heapsort-ai

Moral Reasoning

2 items

RESEARCHarXiv CS.AI·4/9/2026

Blind Refusal: Language Models Refuse to Help Users Evade Unjust, Absurd, and Illegitimate Rules

Este estudo documenta o fenômeno da 'recusa cega' em modelos de linguagem, onde eles se recusam a ajudar usuários a contornar regras, mesmo que estas sejam injustas ou ilegítimas, o que é visto como uma falha de raciocínio moral. A pesquisa apresenta resultados empíricos baseados em um conjunto de dados sintético que cruza famílias de razões para quebrar regras com tipos de autoridade, analisando o comportamento de 18 configurações de modelos.

27
RESEARCHarXiv CS.CL·4/15/2026

Narrative over Numbers: The Identifiable Victim Effect and its Amplification Under Alignment and Reasoning in Large Language Models

This research systematically investigates the Identifiable Victim Effect (IVE) in Large Language Models, a cognitive bias where specific, narratively described victims receive more resources than statistically characterized groups. The large-scale empirical study across 16 frontier LLMs determines if these systems inherit human affective irrationalities in critical applications like humanitarian triage and content moderation.

27