Image Captioning With Controllable and Adaptive Length Levels

Image captioning is a core challenge in computer vision, attracting significant attention. Traditional methods prioritize caption quality, often overlooking style control. Our research enhances method controllability, enabling descriptions of varying detail. By integrating a length level embedding i...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:IEEE transactions on pattern analysis and machine intelligence. - 1979. - 46(2024), 2 vom: 23. Jan., Seite 764-779
1. Verfasser: Ding, Ning (VerfasserIn)
Weitere Verfasser: Deng, Chaorui, Tan, Mingkui, Du, Qing, Ge, Zhiwei, Wu, Qi
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2024
Zugriff auf das übergeordnete Werk:IEEE transactions on pattern analysis and machine intelligence
Schlagworte:Journal Article