RESEARCH27

DisaBench: A Participatory Evaluation Framework for Disability Harms in Language Models

arXiv CS.AI·14 de maio de 2026

DisaBench apresenta uma estrutura de avaliação participativa para analisar danos relacionados à deficiência em grandes modelos de linguagem, abordando a insuficiência dos benchmarks de segurança de propósito geral. Ele inclui uma taxonomia de doze categorias de dano cocriada, uma metodologia que combina prompts benignos e adversariais, e um conjunto de dados com rótulos anotados por humanos, revelando danos sutis frequentemente perdidos pelas avaliações padrão.

language models benchmarking AI ethics disability harms safety evaluation

Ler original ↗