CRIC : A VQA Dataset for Compositional Reasoning on Vision and Commonsense

Alternatively inferring on the visual facts and commonsense is fundamental for an advanced visual question answering (VQA) system. This ability requires models to go beyond the literal understanding of commonsense. The system should not just treat objects as the entrance to query background knowledg...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 5 vom: 01. Mai, Seite 5561-5578
1. Verfasser: Gao, Difei (VerfasserIn)
Weitere Verfasser: Wang, Ruiping, Shan, Shiguang, Chen, Xilin
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2023
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article