Self-Supervised Learning from Untrimmed Videos via Hierarchical Consistency
Natural untrimmed videos provide rich visual content for self-supervised learning. Yet most previous efforts to learn spatio-temporal representations rely on manually trimmed videos, such as Kinetics dataset (Carreira and Zisserman 2017), resulting in limited diversity in visual patterns and limited...
Ausführliche Beschreibung
Bibliographische Detailangaben
Veröffentlicht in: | IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 10 vom: 11. Okt., Seite 12408-12426
|
1. Verfasser: |
Qing, Zhiwu
(VerfasserIn) |
Weitere Verfasser: |
Zhang, Shiwei,
Huang, Ziyuan,
Xu, Yi,
Wang, Xiang,
Gao, Changxin,
Jin, Rong,
Sang, Nong |
Format: | Online-Aufsatz
|
Sprache: | English |
Veröffentlicht: |
2023
|
Zugriff auf das übergeordnete Werk: | IEEE transactions on pattern analysis and machine intelligence
|
Schlagworte: | Journal Article |