Audio-visual continuous speech recognition using a coupled hidden Markov model

Xiaoxing Liu; Yibao Zhao; Xiaobo Pi; Luhong Liang; Ara Nefian

doi:10.21437/icslp.2002-123

ScienceGate Book Chapters

JOURNAL ARTICLE

Audio-visual continuous speech recognition using a coupled hidden Markov model

Xiaoxing Liu Yibao Zhao Xiaobo Pi Luhong Liang Ara Nefian

Year: 2002 Pages: 213-216

DOI: 10.21437/icslp.2002-123

Get Full-Text PDF Get Analytical Report

Abstract

With the increase in the computational complexity of recent computers, audio-visual speech recognition (AVSR) became an attractive research topic that can lead to a robust solution for speech recognition in noisy environments. In the audio visual continuous speech recognition system presented in this paper, the audio and visual observation sequences are integrated using a coupled hidden Markov model (CHMM). The statistical properties of the CHMM can describe the asyncrony of the audio and visual features while preserving their natural correlation over time. The experimental results show that the current system tested on the XM2VTS database reduces the error rate of the audio only speech recognition system at SNR of 0db by over 55%.

Keywords:

Hidden Markov model Speech recognition Computer science Audio visual Audio mining Markov model Artificial intelligence Speaker recognition Word error rate Pattern recognition (psychology) Acoustic model Speech processing Markov chain Machine learning Multimedia

Metrics

Cited By

3.14

FWCI (Field Weighted Citation Impact)

Refs

0.92

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Advanced Data Compression Techniques

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Audio-visual continuous speech recognition using a coupled hidden Markov model

Abstract

Metrics

Citation History

Topics

Related Documents

Audio-visual speech modeling using coupled hidden Markov models

Audio-Visual Speech Fusion Using Coupled Hidden Markov Models

Audio-visual speech modeling using coupled hidden Markov models

Coupled hidden Markov model (CHMM) for continuous audiovisual speech recognition

Continuous speech recognition using hidden Markov models