RESEARCH29
HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine
arXiv CS.LG·23 mai 2026
L'article présente HealthCraft, un environnement public d'apprentissage par renforcement pour évaluer la sécurité des modèles de langage de pointe en médecine d'urgence. Il se concentre sur la sécurité au niveau de la trajectoire, l'utilisation abusive des outils et la pression clinique, construit sur un état du monde FHIR R4 et offrant 195 tâches pour une évaluation complète.
Lire l'original ↗