RESEARCH29
MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction
arXiv CS.CL·21 mai 2026
Cet article présente MedicalBench, un nouveau benchmark pour évaluer les grands modèles de langage dans l'extraction de concepts médicaux à partir des dossiers de santé électroniques. Il se concentre sur le raisonnement médical implicite et l'ancrage des preuves, s'attaquant au défi d'identifier les concepts non explicitement énoncés.
Lire l'original ↗