Multimodal Video Summarization based on Fuzzy Similarity Features

Theodoros Psallidas; Michael D. Vasilakakis; Evaggelos Spyrou; Dimitris K. Iakovidis

doi:10.1109/ivmsp54334.2022.9816266

ScienceGate Book Chapters

JOURNAL ARTICLE

Multimodal Video Summarization based on Fuzzy Similarity Features

Theodoros Psallidas Michael D. Vasilakakis Evaggelos Spyrou Dimitris K. Iakovidis

Year: 2022

DOI: 10.1109/ivmsp54334.2022.9816266

Get Full-Text PDF Get Analytical Report

Abstract

The continuously growing number of user-generated videos has increased the need for efficient browsing through content collections and repositories, which in turn requires descriptive, yet compact representations. To this goal, a popular approach is to create a visual summary, which is by far more expressive compared to other approaches, e.g., textual descriptions. In this work, we present a video summarization approach that is based on the extraction and fusion of audio and visual features, in order to produce dynamic video summaries, i.e., comprising of the most important video segments of the original video, while preserving their temporal order. Based on the extracted features, each segment is classified as 'interesting,' or 'uninteresting,' thus included in the final summary, or not. The novelty of our approach is that prior to classification, the fused features are fuzzified, thus becoming more intuitive and robust to uncertainty. We evaluate our approach using a large dataset of user-generated videos and demonstrate that fuzzy features are able to boost classification performance, providing for more concrete video summaries. © 2022 IEEE.

Keywords:

Automatic summarization Computer science Novelty Fuzzy logic Artificial intelligence Similarity (geometry) Information retrieval Feature extraction Image (mathematics)

Metrics

Cited By

0.50

FWCI (Field Weighted Citation Impact)

Refs

0.59

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Video Analysis and Summarization

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Image Retrieval and Classification Techniques

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Multimodal Video Summarization based on Fuzzy Similarity Features

Abstract

Metrics

Citation History

Topics

Related Documents

Video Summarization Based on Multimodal Features

Key-frame-Based Video Summarization Using Similarity Measure

Shot-based similarity measure for content-based video summarization

Multimodal Video Summarization using Attention based Transformers (MVSAT)

Multimodal-Based and Aesthetic-Guided Narrative Video Summarization