RESEARCHarXiv CS.CL·5/6/2026
MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports
MedStruct-S ist ein neuer Benchmark für die semi-strukturierte Informationsgewinnung aus OCR-abgeleiteten klinischen Berichten, der Herausforderungen wie heterogene Schlüsselrepräsentationen und OCR-Rauschen adressiert. Er zielt darauf ab, die Modellrobustheit in realen Szenarien für die Schlüsselentdeckung, schlüsselkonditionierte QA und die Extraktion von Schlüssel-Wert-Paaren zu bewerten.
27