heapsort
RESEARCH28

ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV

arXiv CS.CL·13 mai 2026

Cet article introduit ClinicalBench, un nouveau benchmark de 400 questions pour tester la récupération sensible aux assertions dans les questions-réponses cliniques sur MIMIC-IV à partir de notes EHR réelles. Il présente également EpiKG, un système de graphe de connaissances patient qui améliore la récupération en tenant compte de la négation et de la temporalité, démontrant des améliorations significatives des performances des LLM cliniques.

Lire l'original