LongVLM: Efficient Long Video Understanding via Large Language Models

BOOK-CHAPTER

Year: 2024 Lecture notes in computer science Pages: 453-470 Publisher: Springer Science+Business Media

DOI: 10.1007/978-3-031-73414-4_26

Keywords:

Computer science Programming language Computer graphics (images) Natural language processing

Metrics

Cited By

17.14

FWCI (Field Weighted Citation Impact)

Refs

0.99

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Multimodal Machine Learning Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Human Pose and Action Recognition

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Video Analysis and Summarization

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition