EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs
O artigo apresenta EHRBench, um benchmark automatizado e confiável baseado em prontuários eletrônicos de saúde (EHRs) para avaliar LLMs na tomada de decisões clínicas, abordando a compreensão insuficiente da confiabilidade dessas em tarefas clínicas reais. O objetivo é garantir escala e qualidade na avaliação de modelos de tomada de decisões clínicas (CDM).