RESEARCH28
EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs
arXiv CS.AI·1 juin 2026
Cet article présente EHRBench, un benchmark automatisé et fiable basé sur les dossiers de santé électroniques (DSE) pour évaluer les LLM dans la prise de décision clinique, comblant le manque de compréhension de leur fiabilité dans des tâches cliniques réelles. Il vise à garantir à la fois l'échelle et la qualité dans l'évaluation des modèles de prise de décision clinique (CDM).
Lire l'original ↗