TMFER: Multimodal Fusion Emotion Recognition Algorithm Based on Transformer

Zunying Qin; Xingyuan Chen; Guodong Li; Jingru Cui

doi:10.1109/ichci58871.2023.10277906

ScienceGate Book Chapters

JOURNAL ARTICLE

TMFER: Multimodal Fusion Emotion Recognition Algorithm Based on Transformer

Zunying Qin Xingyuan Chen Guodong Li Jingru Cui

Year: 2023 Pages: 1-8

DOI: 10.1109/ichci58871.2023.10277906

Get Full-Text PDF Get Analytical Report

Abstract

According to the problems of the existing emotion recognition algorithms, which are not rich in emotion information, weak in feature representation and not high in recognition accuracy, this paper proposes a multimodal fusion emotion recognition algorithm based on Transformer (TMFER), which fuses three modalities of text, speech and image information for emotion recognition. For the different characteristics of each modal information, Bert model pre-training processing, MFCC feature extraction and CNN feature extractor extraction methods are used to extract features for each modality respectively, to explore deeper features. To address the problem of unreasonable combination of multi-modal features, the Transformer Encode multi-headed attention mechanism is used to build a feature fusion module to extract and combine potential feature information in different modalities in parallel. The fused data are fed into the algorithm classification module for sentiment recognition classification, and a joint supervised loss function based on large margin learning is customized to solve the problem of unbalanced classification and feature confounding in the baseline model. Finally, based on the IEMOCAP and MELD multimodal datasets, the TMFER algorithm is experimentally compared with current algorithms in the field that are more effective in emotion recognition classification. The experimental results show that the TMFER algorithm outperforms other algorithms in all evaluation metrics.

Keywords:

Computer science Feature extraction Artificial intelligence Pattern recognition (psychology) Machine learning Feature (linguistics) Emotion recognition Algorithm

Metrics

Cited By

0.83

FWCI (Field Weighted Citation Impact)

Refs

0.69

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Emotion and Mood Recognition

Social Sciences → Psychology → Experimental and Cognitive Psychology

Sentiment Analysis and Opinion Mining

Physical Sciences → Computer Science → Artificial Intelligence

Advanced Computing and Algorithms

Social Sciences → Social Sciences → Urban Studies

TMFER: Multimodal Fusion Emotion Recognition Algorithm Based on Transformer

Abstract

Metrics

Citation History

Topics

Related Documents

Multimodal Transformer Fusion for Continuous Emotion Recognition

Multimodal Emotion Recognition With Transformer-Based Self Supervised Feature Fusion

Multimodal transformer augmented fusion for speech emotion recognition

Multimodal Transformer Fusion for Emotion Recognition: A Survey

Multimodal contextual transformer augmented fusion for emotion recognition