Image Captioning With Controllable and Adaptive Length Levels
Image captioning is a core challenge in computer vision, attracting significant attention. Traditional methods prioritize caption quality, often overlooking style control. Our research enhances method controllability, enabling descriptions of varying detail. By integrating a length level embedding i...
Ausführliche Beschreibung
Bibliographische Detailangaben
Veröffentlicht in: | IEEE transactions on pattern analysis and machine intelligence. - 1979. - 46(2024), 2 vom: 23. Jan., Seite 764-779
|
1. Verfasser: |
Ding, Ning
(VerfasserIn) |
Weitere Verfasser: |
Deng, Chaorui,
Tan, Mingkui,
Du, Qing,
Ge, Zhiwei,
Wu, Qi |
Format: | Online-Aufsatz
|
Sprache: | English |
Veröffentlicht: |
2024
|
Zugriff auf das übergeordnete Werk: | IEEE transactions on pattern analysis and machine intelligence
|
Schlagworte: | Journal Article |