RESEARCH27
Benchmarking Deflection and Hallucination in Large Vision-Language Models
arXiv CS.CL·15 avril 2026
Cet article propose VLM-DeflectionBench, un nouveau benchmark pour les Large Vision-Language Models (LVLM) qui s'attaque à la déviation et à l'hallucination face à des preuves conflictuelles ou insuffisantes. Il introduit également un pipeline dynamique de curation de données pour maintenir la pertinence du benchmark et un protocole d'évaluation détaillé.
Lire l'original ↗