GQA: A New Dataset for Real-World Visual Reasoning and Compositional QuestionAnswering
GQA ist ein neues Dataset, das entwickelt wurde, um KI-Systeme im visuellen Denken und bei der Beantwortung kompositioneller Fragen herauszufordern und zu bewerten. Es zielt darauf ab, das Szenenverständnis und die multimodale Interaktion in realen Szenarien voranzutreiben.