RESEARCH27
Seeing Through Experts Eyes A Foundational Vision Language Model Trained on Radiologists Gaze and Reasoning
arXiv CS.AI·17. April 2026
GazeX ist ein neues Vision-Sprachmodell, das anhand von Augenbewegungsdaten und Schlussfolgerungen von Radiologen trainiert wurde, um die Interpretation von Brust-Röntgenbildern zu verbessern. Das Modell lernt, die räumliche und zeitliche Aufmerksamkeit von Experten nachzuahmen, um die Lücke zwischen Modellausgaben und klinischem diagnostischem Denken zu schließen.
Original lesen ↗