RESEARCHarXiv CS.CL·vor 19T
MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction
Dieses Papier stellt MedicalBench vor, einen neuen Benchmark zur Bewertung großer Sprachmodelle bei der Extraktion medizinischer Konzepte aus elektronischen Gesundheitsakten. Es konzentriert sich auf implizites medizinisches Denken und Evidenzfundierung, um die Herausforderung der Identifizierung nicht explizit genannter Konzepte zu bewältigen.
29