RESEARCHarXiv CS.CL·06/05/2026
MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports
MedStruct-S é um novo benchmark para a extração de informações semi-estruturadas de relatórios clínicos derivados de OCR, abordando desafios como representações de chaves heterogêneas e ruído de OCR. Ele visa avaliar a robustez de modelos em cenários do mundo real para descoberta de chaves, QA condicionado a chaves e extração de pares chave-valor.
27