RESEARCH29
MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction
arXiv CS.CL·21. Mai 2026
Dieses Papier stellt MedicalBench vor, einen neuen Benchmark zur Bewertung großer Sprachmodelle bei der Extraktion medizinischer Konzepte aus elektronischen Gesundheitsakten. Es konzentriert sich auf implizites medizinisches Denken und Evidenzfundierung, um die Herausforderung der Identifizierung nicht explizit genannter Konzepte zu bewältigen.
Original lesen ↗