Addressing Accent Mismatch In Mandarin-English Code-Switching Speech Recognition

Zhili Tan; Xinghua Fan; Hui Zhu; Ed Lin

doi:10.1109/icassp40776.2020.9053752

ScienceGate Book Chapters

JOURNAL ARTICLE

Addressing Accent Mismatch In Mandarin-English Code-Switching Speech Recognition

Zhili Tan Xinghua Fan Hui Zhu Ed Lin

Year: 2020 Vol: abs 1810 12620 Pages: 8259-8263

DOI: 10.1109/icassp40776.2020.9053752

Get Full-Text PDF Get Analytical Report

Abstract

Automatic speech recognition systems suffer from accuracy degradation when code-switching (multiple languages are spoken in a single utterance) is encountered. This is especially common for non-native speakers where there is a mismatch between speech and acoustic model. In this paper, we experiment on Mandarin-English code-switching audio spoken by native Chinese speakers and evaluate three techniques to improve accuracy-data adaptation, individual senone modeling and lexicon enrichment. Our results show the recognition of accented speech improves up to 12% on various code-switching datasets. We also propose several metrics to measure code-switching recognition quality, not captured in typical word error rate (WER) measurement.

Keywords:

Computer science Speech recognition Code-switching Mandarin Chinese Utterance Hidden Markov model Natural language processing Stress (linguistics) Artificial intelligence Word error rate Code (set theory) Acoustic model Speech processing Linguistics

Metrics

Cited By

0.73

FWCI (Field Weighted Citation Impact)

Refs

0.75

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Speech Recognition and Synthesis

Physical Sciences → Computer Science → Artificial Intelligence

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Addressing Accent Mismatch In Mandarin-English Code-Switching Speech Recognition

Abstract

Metrics

Citation History

Topics

Related Documents

Non-Autoregressive Mandarin-English Code-Switching Speech Recognition

Pronunciation augmentation for Mandarin-English code-switching speech recognition

Acoustic data augmentation for Mandarin-English code-switching speech recognition

Cyclic Transfer Learning for Mandarin-English Code-Switching Speech Recognition

Investigating End-to-end Speech Recognition for Mandarin-english Code-switching