Event-centric multi-modal fusion method for dense video captioning

Zhi Yong Chang; Dexin Zhao; Huilin Chen; Jingdan Li; Pengfei Liu

doi:10.1016/j.neunet.2021.11.017

ScienceGate Book Chapters

JOURNAL ARTICLE

Event-centric multi-modal fusion method for dense video captioning

Zhi Yong Chang Dexin Zhao Huilin Chen Jingdan Li Pengfei Liu

Year: 2021 Journal: Neural Networks Vol: 146 Pages: 120-129 Publisher: Elsevier BV

DOI: 10.1016/j.neunet.2021.11.017

Get Full-Text PDF Get Analytical Report

Keywords:

Computer science Closed captioning Event (particle physics) Benchmark (surveying) Exploit Fuse (electrical) ENCODE Modal Artificial intelligence Process (computing) Machine learning Natural language processing Image (mathematics)

Metrics

Cited By

1.84

FWCI (Field Weighted Citation Impact)

Refs

0.87

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Multimodal Machine Learning Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Video Analysis and Summarization

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Human Pose and Action Recognition

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Event-centric multi-modal fusion method for dense video captioning

Metrics

Citation History

Topics

Related Documents

Multi-modal Dense Video Captioning

Event-Centric Hierarchical Representation for Dense Video Captioning

Video Captioning Method Based on Multi-Modal Information Fusion

Multi-Modal Hierarchical Attention-Based Dense Video Captioning

Event-Equalized Dense Video Captioning