Large Vision-Language Models — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artigo propõe um novo benchmark, VLM-DeflectionBench, para Large Vision-Language Models (LVLMs) que aborda a deflexão e a alucinação em cenários de evidências conflitantes ou insuficientes. Ele também introduz uma pipeline de curadoria de dados dinâmica para manter a relevância do benchmark e um protocolo de avaliação detalhado para analisar o comportamento do modelo.

Retrieval Augmented Generation hallucination Benchmarking LVLM