RESEARCH27
MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports
arXiv CS.CL·6 de mayo de 2026
MedStruct-S es un nuevo benchmark para la extracción de información semiestructurada de informes clínicos derivados de OCR, abordando desafíos como representaciones de claves heterogéneas y ruido de OCR. Su objetivo es evaluar la robustez del modelo en entornos del mundo real para el descubrimiento de claves, QA condicionado a claves y extracción de pares clave-valor.
Leer original ↗