RESEARCH27
A Multi-Domain Red Teaming Framework for Safety, Robustness, and Fairness Evaluation of Medical Large Language Models
arXiv CS.CL·2 de junho de 2026
Um novo framework de red teaming foi desenvolvido para avaliar a segurança, robustez e justiça de Large Language Models (LLMs) médicos em 690 cenários clínicos. A pesquisa revelou variância significativa de desempenho e falhas críticas em cenários de segurança, mesmo em sistemas de alta pontuação.
Ler original ↗