RESEARCHarXiv CS.CL·il y a 19j
MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction
Cet article présente MedicalBench, un nouveau benchmark pour évaluer les grands modèles de langage dans l'extraction de concepts médicaux à partir des dossiers de santé électroniques. Il se concentre sur le raisonnement médical implicite et l'ancrage des preuves, s'attaquant au défi d'identifier les concepts non explicitement énoncés.
29