VisQA : X-raying Vision and Language Reasoning in Transformers

Visual Question Answering systems target answering open-ended textual questions given input images. They are a testbed for learning high-level reasoning with a primary use in HCI, for instance assistance for the visually impaired. Recent research has shown that state-of-the-art models tend to produc...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:	IEEE transactions on visualization and computer graphics. - 1996. - 28(2022), 1 vom: 01. Jan., Seite 976-986
1. Verfasser:	Jaunet, Theo (VerfasserIn)
Weitere Verfasser:	Kervadec, Corentin, Vuillemot, Romain, Antipov, Grigory, Baccouche, Moez, Wolf, Christian
Format:	Online-Aufsatz
Sprache:	English
Veröffentlicht:	2022
Zugriff auf das übergeordnete Werk:	IEEE transactions on visualization and computer graphics
Schlagworte:	Journal Article

Online verfügbar	Volltext