RESEARCH27

Benchmarking Deflection and Hallucination in Large Vision-Language Models

arXiv CS.CL·15 avril 2026

Cet article propose VLM-DeflectionBench, un nouveau benchmark pour les Large Vision-Language Models (LVLM) qui s'attaque à la déviation et à l'hallucination face à des preuves conflictuelles ou insuffisantes. Il introduit également un pipeline dynamique de curation de données pour maintenir la pertinence du benchmark et un protocole d'évaluation détaillé.

Retrieval Augmented Generation hallucination Benchmarking LVLM Large Vision-Language Models

Lire l'original ↗