RESEARCH27
DisaBench: A Participatory Evaluation Framework for Disability Harms in Language Models
arXiv CS.AI·14 de maio de 2026
DisaBench apresenta uma estrutura de avaliação participativa para analisar danos relacionados à deficiência em grandes modelos de linguagem, abordando a insuficiência dos benchmarks de segurança de propósito geral. Ele inclui uma taxonomia de doze categorias de dano cocriada, uma metodologia que combina prompts benignos e adversariais, e um conjunto de dados com rótulos anotados por humanos, revelando danos sutis frequentemente perdidos pelas avaliações padrão.
Ler original ↗