heapsort
RESEARCH27

GAZE: Grounded Agentic Zero-shot Evaluation with Viewer-Level Tools and Literature Retrieval on Rare Brain MRI

arXiv CS.LG·5. Mai 2026

GAZE ist ein Framework, das medizinischen Vision-Language-Modellen (VLMs) ermöglicht, Gehirn-MRT-Bilder iterativ mithilfe von Viewer-Tools und Literaturabruf zu analysieren. Es erreichte 58,2 mAP bei der Läsionslokalisierung und 34,9 % Top-1-Diagnosegenauigkeit auf dem NOVA-Benchmark für seltene neurologische Erkrankungen.

Original lesen