GQA: A New Dataset for Real-World Visual Reasoning and Compositional QuestionAnswering
GQA é um novo conjunto de dados projetado para desafiar e avaliar sistemas de IA em raciocínio visual e resposta a perguntas composicionais. Ele visa promover a compreensão da cena e a interação multimodal em cenários do mundo real.