RESEARCH27

A Multi-Domain Red Teaming Framework for Safety, Robustness, and Fairness Evaluation of Medical Large Language Models

arXiv CS.CL·June 2, 2026

A new multi-domain red teaming framework was developed to evaluate the safety, robustness, and fairness of medical Large Language Models (LLMs) across 690 clinically grounded scenarios. The research revealed substantial performance variance and critical failures in safety-critical scenarios, even in high-performing systems.

robustness safety Healthcare security fairness

Read original ↗