RESEARCH27

A Multi-Domain Red Teaming Framework for Safety, Robustness, and Fairness Evaluation of Medical Large Language Models

arXiv CS.CL·2 de junho de 2026

Um novo framework de red teaming foi desenvolvido para avaliar a segurança, robustez e justiça de Large Language Models (LLMs) médicos em 690 cenários clínicos. A pesquisa revelou variância significativa de desempenho e falhas críticas em cenários de segurança, mesmo em sistemas de alta pontuação.

robustness Safety Healthcare security Fairness

Ler original ↗