heapsort
RESEARCH27

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

arXiv CS.CL·6. Mai 2026

MedStruct-S ist ein neuer Benchmark für die semi-strukturierte Informationsgewinnung aus OCR-abgeleiteten klinischen Berichten, der Herausforderungen wie heterogene Schlüsselrepräsentationen und OCR-Rauschen adressiert. Er zielt darauf ab, die Modellrobustheit in realen Szenarien für die Schlüsselentdeckung, schlüsselkonditionierte QA und die Extraktion von Schlüssel-Wert-Paaren zu bewerten.

Original lesen