Cross-modal Deep Learning Applications: Audio-Visual Retrieval

Cong Jin; Tian Zhang; Shouxun Liu; Yun Tie; Xin Lv; Jianguang Li; Wencai Yan; Ming Yan; Qian Xu; Yicong Guan; Zhenggougou Yang

doi:10.1007/978-3-030-68780-9_26

ScienceGate Book Chapters

BOOK-CHAPTER

Cross-modal Deep Learning Applications: Audio-Visual Retrieval

Cong Jin Tian Zhang Shouxun Liu Yun Tie Xin Lv Jianguang Li Wencai Yan Ming Yan Qian Xu Yicong Guan Zhenggougou Yang

Year: 2021 Lecture notes in computer science Pages: 301-313 Publisher: Springer Science+Business Media

DOI: 10.1007/978-3-030-68780-9_26

Get Full-Text PDF Get Analytical Report

Keywords:

Computer science Modal Similarity (geometry) Subspace topology Artificial intelligence Deep learning Modalities Feature learning Artificial neural network Feature (linguistics) Representation (politics) Pattern recognition (psychology) Speech recognition Image (mathematics)

Metrics

Cited By

2.79

FWCI (Field Weighted Citation Impact)

Refs

0.91

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Video Analysis and Summarization

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Cross-modal Deep Learning Applications: Audio-Visual Retrieval

Metrics

Citation History

Topics

Related Documents

Deep Learning Cross-Modal Learning for Audio-Visual Speech Recognition

Deep Cross-Modal Audio-Visual Generation

Deep Voice-Visual Cross-Modal Retrieval with Deep Feature Similarity Learning

DCLMA: Deep correlation learning with multi-modal attention for visual-audio retrieval

Cross-Modal Retrieval Using Deep Learning