← heapsort-ai

Large Vision-Language Models

1 items

RESEARCHarXiv CS.CL·15/04/2026

Benchmarking Deflection and Hallucination in Large Vision-Language Models

Este artigo propõe um novo benchmark, VLM-DeflectionBench, para Large Vision-Language Models (LVLMs) que aborda a deflexão e a alucinação em cenários de evidências conflitantes ou insuficientes. Ele também introduz uma pipeline de curadoria de dados dinâmica para manter a relevância do benchmark e um protocolo de avaliação detalhado para analisar o comportamento do modelo.

27