Video Transformers : A Survey

Transformer models have shown great success handling long-range interactions, making them a promising tool for modeling video. However, they lack inductive biases and scale quadratically with input length. These limitations are further exacerbated when dealing with the high dimensionality introduced...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 11 vom: 09. Nov., Seite 12922-12943
1. Verfasser: Selva, Javier (VerfasserIn)
Weitere Verfasser: Johansen, Anders S, Escalera, Sergio, Nasrollahi, Kamal, Moeslund, Thomas B, Clapes, Albert
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2023
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article