TagCLIP : Improving Discrimination Ability of Zero-Shot Semantic Segmentation

Contrastive Language-Image Pre-training (CLIP) has recently shown great promise in pixel-level zero-shot learning tasks. However, existing approaches utilizing CLIP's text and patch embeddings to generate semantic masks often misidentify input pixels from unseen classes, leading to confusion be...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 46(2024), 12 vom: 04. Nov., Seite 11287-11297
1. Verfasser: Li, Jingyao (VerfasserIn)
Weitere Verfasser: Chen, Pengguang, Qian, Shengju, Liu, Shu, Jia, Jiaya
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2024
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article