RESEARCHarXiv CS.CL·06/05/2026
MedStruct-S: A Benchmark for Key Discovery, Key-Conditioned QA and Semi-Structured Extraction from OCR Clinical Reports
MedStruct-S est un nouveau benchmark pour l'extraction d'informations semi-structurées à partir de rapports cliniques dérivés de l'OCR, s'attaquant aux défis des représentations de clés hétérogènes et du bruit de l'OCR. Il vise à évaluer la robustesse des modèles dans des scénarios réels pour la découverte de clés, le QA conditionné par les clés et l'extraction de paires clé-valeur.
27