RESEARCH29
HealthCraft: A Reinforcement Learning Safety Environment for Emergency Medicine
arXiv CS.LG·23 de maio de 2026
O artigo apresenta o HealthCraft, um ambiente público de aprendizado por reforço para avaliar a segurança de modelos de linguagem de fronteira na medicina de emergência. Ele foca na segurança em nível de trajetória, uso indevido de ferramentas e pressão clínica, construído sobre um estado de mundo FHIR R4 e oferecendo 195 tarefas para avaliação abrangente.
Ler original ↗