Quantformer : Learning Extremely Low-Precision Vision Transformers
In this article, we propose extremely low-precision vision transformers called Quantformer for efficient inference. Conventional network quantization methods directly quantize weights and activations of fully-connected layers without considering properties of transformer architectures. Quantization...
Ausführliche Beschreibung
Bibliographische Detailangaben
Veröffentlicht in: | IEEE transactions on pattern analysis and machine intelligence. - 1979. - 45(2023), 7 vom: 16. Juli, Seite 8813-8826
|
1. Verfasser: |
Wang, Ziwei
(VerfasserIn) |
Weitere Verfasser: |
Wang, Changyuan,
Xu, Xiuwei,
Zhou, Jie,
Lu, Jiwen |
Format: | Online-Aufsatz
|
Sprache: | English |
Veröffentlicht: |
2023
|
Zugriff auf das übergeordnete Werk: | IEEE transactions on pattern analysis and machine intelligence
|
Schlagworte: | Journal Article |