RESEARCH29

MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction

arXiv CS.CL·21 mai 2026

Cet article présente MedicalBench, un nouveau benchmark pour évaluer les grands modèles de langage dans l'extraction de concepts médicaux à partir des dossiers de santé électroniques. Il se concentre sur le raisonnement médical implicite et l'ancrage des preuves, s'attaquant au défi d'identifier les concepts non explicitement énoncés.

LLMs concept extraction Healthcare Benchmarking medical AI

Lire l'original ↗