heapsort
RESEARCH27

MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports

arXiv CS.CL·6 de maio de 2026

MedStruct-S é um novo benchmark para a extração de informações semi-estruturadas de relatórios clínicos derivados de OCR, abordando desafios como representações de chaves heterogêneas e ruído de OCR. Ele visa avaliar a robustez de modelos em cenários do mundo real para descoberta de chaves, QA condicionado a chaves e extração de pares chave-valor.

Ler original