Learning Probabilistic Presence-Absence Evidence for Weakly-Supervised Audio-Visual Event Perception

With only video-level event labels, this paper targets at the task of weakly-supervised audio-visual event perception (WS-AVEP), which aims to temporally localize and categorize events that belong to each modality. Despite the recent progress, most existing approaches either ignore the unsynchronize...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 47(2025), 6 vom: 03. Mai, Seite 4787-4802
1. Verfasser: Gao, Junyu (VerfasserIn)
Weitere Verfasser: Chen, Mengyuan, Xu, Changsheng
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2025
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article