Self-Supervised Learning from Untrimmed Videos via Hierarchical Consistency

Natural untrimmed videos provide rich visual content for self-supervised learning. Yet most previous efforts to learn spatio-temporal representations rely on manually trimmed videos, such as Kinetics dataset (Carreira and Zisserman 2017), resulting in limited diversity in visual patterns and limited...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 10 vom: 11. Okt., Seite 12408-12426
1. Verfasser: Qing, Zhiwu (VerfasserIn)
Weitere Verfasser: Zhang, Shiwei, Huang, Ziyuan, Xu, Yi, Wang, Xiang, Gao, Changxin, Jin, Rong, Sang, Nong
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2023
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article