Large Vision-Language Models — articles, actualités et recherches IA

RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Cet article propose VLM-DeflectionBench, un nouveau benchmark pour les Large Vision-Language Models (LVLM) qui s'attaque à la déviation et à l'hallucination face à des preuves conflictuelles ou insuffisantes. Il introduit également un pipeline dynamique de curation de données pour maintenir la pertinence du benchmark et un protocole d'évaluation détaillé.

Retrieval Augmented Generation hallucination benchmarking LVLM