RESEARCH29

MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction

arXiv CS.CL·21. Mai 2026

Dieses Papier stellt MedicalBench vor, einen neuen Benchmark zur Bewertung großer Sprachmodelle bei der Extraktion medizinischer Konzepte aus elektronischen Gesundheitsakten. Es konzentriert sich auf implizites medizinisches Denken und Evidenzfundierung, um die Herausforderung der Identifizierung nicht explizit genannter Konzepte zu bewältigen.

LLMs concept extraction Healthcare Benchmarking medical AI

Original lesen ↗