Hierarchical cross-modal contextual attention network for visual grounding

Xin Xu; Gang Lv; Yining Sun; HU Yu-xia; Fudong Nian

doi:10.1007/s00530-023-01097-8

ScienceGate Book Chapters

JOURNAL ARTICLE

Hierarchical cross-modal contextual attention network for visual grounding

Xin Xu Gang Lv Yining Sun HU Yu-xia Fudong Nian

Year: 2023 Journal: Multimedia Systems Vol: 29 (4)Pages: 2073-2083 Publisher: Springer Science+Business Media

DOI: 10.1007/s00530-023-01097-8

Get Full-Text PDF Get Analytical Report

Keywords:

Computer science Modal Transformer Sentence Modality (human–computer interaction) Artificial intelligence Encoder Natural language processing Task (project management) Visualization

Metrics

Cited By

0.73

FWCI (Field Weighted Citation Impact)

Refs

0.65

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Multimodal Machine Learning Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Advanced Image and Video Retrieval Techniques

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Visual Attention and Saliency Detection

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Hierarchical cross-modal contextual attention network for visual grounding

Metrics

Citation History

Topics

Related Documents

Semantic-Aligned Cross-Modal Visual Grounding Network with Transformers

Hierarchical Multi-modal Contextual Attention Network for Fake News Detection

Hierarchical Cross-Modal Attention Network for Target Re-Identification

Contextual Cross-Modal Attention for Audio-Visual Deepfake Detection and Localization

Cross‐modal contextual memory guides selective attention in visual‐search tasks