heapsort
RESEARCH28

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

arXiv CS.AI·1 juin 2026

Cet article présente EHRBench, un benchmark automatisé et fiable basé sur les dossiers de santé électroniques (DSE) pour évaluer les LLM dans la prise de décision clinique, comblant le manque de compréhension de leur fiabilité dans des tâches cliniques réelles. Il vise à garantir à la fois l'échelle et la qualité dans l'évaluation des modèles de prise de décision clinique (CDM).

Lire l'original