heapsort
RESEARCH28

EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs

arXiv CS.AI·1. Juni 2026

Die Arbeit stellt EHRBench vor, einen automatisierten und zuverlässigen, EHR-basierten Benchmark zur Bewertung von LLM-basierten klinischen Entscheidungsfindungen, der das unzureichende Verständnis der Zuverlässigkeit von LLMs bei realen klinischen Aufgaben adressiert. Ziel ist es, sowohl Umfang als auch Qualität bei der Bewertung von CDM-Modellen sicherzustellen.

Original lesen