heapsort
RESEARCH27

Benchmarking Deflection and Hallucination in Large Vision-Language Models

arXiv CS.CL·15 avril 2026

Cet article propose VLM-DeflectionBench, un nouveau benchmark pour les Large Vision-Language Models (LVLM) qui s'attaque à la déviation et à l'hallucination face à des preuves conflictuelles ou insuffisantes. Il introduit également un pipeline dynamique de curation de données pour maintenir la pertinence du benchmark et un protocole d'évaluation détaillé.

Lire l'original