RESEARCH27
Breaking the Illusion: When Positive Meets Negative in Multimodal Decoding
arXiv CS.LG·11 mai 2026
Un nouveau cadre d'inférence sans entraînement, la Décodification Positive et Négative (PND), est introduit pour lutter contre l'hallucination d'objets dans les Modèles Vision-Langage (VLM). Le PND assure la fidélité visuelle via un mécanisme de contraste à double chemin, offrant des performances de pointe sans réentraînement.
Lire l'original ↗