Quantformer : Learning Extremely Low-Precision Vision Transformers

In this article, we propose extremely low-precision vision transformers called Quantformer for efficient inference. Conventional network quantization methods directly quantize weights and activations of fully-connected layers without considering properties of transformer architectures. Quantization...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:	IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 7 vom: 16. Juli, Seite 8813-8826
1. Verfasser:	Wang, Ziwei (VerfasserIn)
Weitere Verfasser:	Wang, Changyuan, Xu, Xiuwei, Zhou, Jie, Lu, Jiwen
Format:	Online-Aufsatz
Sprache:	English
Veröffentlicht:	2023
Zugriff auf das übergeordnete Werk:	IEEE transactions on pattern analysis and machine intelligence
Schlagworte:	Journal Article

Online verfügbar	Volltext