RESEARCHarXiv CS.LG·05/05/2026
GAZE: Grounded Agentic Zero-shot Evaluation with Viewer-Level Tools and Literature Retrieval on Rare Brain MRI
GAZE est un framework permettant aux Modèles Vision-Langage (VLM) médicaux d'analyser de manière itérative des images d'IRM cérébrale à l'aide d'outils de visualisation et de récupération de littérature. Il a atteint 58,2 mAP pour la localisation des lésions et 34,9 % de précision diagnostique Top-1 sur le benchmark NOVA pour les affections neurologiques rares.
27