RESEARCH27

Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning

arXiv CS.AI·17. April 2026

GazeX ist ein neues Vision-Sprachmodell, das anhand von Augenbewegungsdaten und Schlussfolgerungen von Radiologen trainiert wurde, um die Interpretation von Brust-Röntgenbildern zu verbessern. Das Modell lernt, die räumliche und zeitliche Aufmerksamkeit von Experten nachzuahmen, um die Lücke zwischen Modellausgaben und klinischem diagnostischem Denken zu schließen.

Vision-Language Models computer vision medical AI diagnostic tools

Original lesen ↗