RESEARCHarXiv CS.LG·5/5/2026
GAZE: Grounded Agentic Zero-shot Evaluation with Viewer-Level Tools and Literature Retrieval on Rare Brain MRI
GAZE es un framework que permite a los Modelos de Visión-Lenguaje (VLM) médicos analizar imágenes de RMN cerebral de forma iterativa, utilizando herramientas de visualización y recuperación de literatura. Alcanzó 58.2 mAP en localización de lesiones y 34.9% de precisión diagnóstica Top-1 en el benchmark NOVA para condiciones neurológicas raras.
27