Information fusion techniques in Audio-Visual Speech Recognition

Harun Karabalkan; Hakan Erdoğan

doi:10.1109/siu.2009.5136443

ScienceGate Book Chapters

JOURNAL ARTICLE

Information fusion techniques in Audio-Visual Speech Recognition

Harun Karabalkan Hakan Erdoğan

Year: 2009 Vol: 3 Pages: 504-507

DOI: 10.1109/siu.2009.5136443

Get Full-Text PDF Get Analytical Report

Abstract

It is well known that human perception of speech relies both on audio and visual information. However, the physiology of information fusion process in humans is still indefinite which attracts scientists' attention to information fusion process for audio-visual speech recognition. In this work, a novel tandem hybrid approach is introduced for an efficient audio-visual speech recognition system and the performance of the proposed technique is experimentally compared with the widely used Multiple Stream Hidden Markov Model (MSHMM) approach.

Keywords:

Computer science Hidden Markov model Speech recognition Audio visual Audio mining Process (computing) Perception Artificial intelligence Visualization Information fusion Sensor fusion Speech processing Pattern recognition (psychology) Voice activity detection Multimedia

Metrics

Cited By

0.35

FWCI (Field Weighted Citation Impact)

Refs

0.61

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Blind Source Separation Techniques

Physical Sciences → Computer Science → Signal Processing

Video Surveillance and Tracking Methods

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Information fusion techniques in Audio-Visual Speech Recognition

Abstract

Metrics

Topics

Related Documents

Multistage information fusion for audio-visual speech recognition

Analysis of multimodal fusion techniques for audio-visual speech recognition

Bimodal fusion in audio-visual speech recognition

Adaptive Decision Fusion for Audio-Visual Speech Recognition

Audio-visual fuzzy fusion for robust speech recognition