Automatic pronunciation verification for speech recognition

Kanishka Rao; Fuchun Peng; Françoise Beaufays

doi:10.1109/icassp.2015.7178955

ScienceGate Book Chapters

JOURNAL ARTICLE

Automatic pronunciation verification for speech recognition

Kanishka Rao Fuchun Peng Françoise Beaufays

Year: 2015 Vol: 21 Pages: 5162-5166

DOI: 10.1109/icassp.2015.7178955

Get Full-Text PDF Get Analytical Report

Abstract

Pronunciations for words are a critical component in an automated speech recognition system (ASR) as mis-recognitions may be caused by missing or inaccurate pronunciations. The need for high quality pronunciations has recently motivated data-driven techniques to generate them [1]. We propose a data-driven and language-independent framework for verification of such pronunciations to further improve the lexicon quality in ASR. New candidate pronunciations are verified by re-recognizing historical audio logs and examining the associated recognition costs. We build an additional pronunciation quality feature from word and pronunciation frequencies in logs. A machine learned classifier trained on these features achieves nearly 90% accuracy in labeling good vs bad pronunciations across all languages we tested. New pronunciations verified as good may be added to a dictionary, while bad pronunciations may be discarded or sent to experts for further evaluation. We simultaneously verify 5,000 to 30,000 new pronunciations within a few hours and show improvements in the ASR performance as a result of including pronunciations verified by this system.

Keywords:

Pronunciation Computer science Lexicon Artificial intelligence Speech recognition Natural language processing Classifier (UML) Feature (linguistics) Training set Quality (philosophy) Linguistics

Metrics

Cited By

0.31

FWCI (Field Weighted Citation Impact)

Refs

0.78

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Speech Recognition and Synthesis

Physical Sciences → Computer Science → Artificial Intelligence

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Automatic pronunciation verification for speech recognition

Abstract

Metrics

Citation History

Topics

Related Documents

Automatic Speech Recognition and Pronunciation Training

PRONUNCIATION LEARNING USING AUTOMATIC SPEECH RECOGNITION

Automatic speech recognition and pronunciation learning

Improving English pronunciation via automatic speech recognition technology

Improving English Pronunciation Via Automatic Speech Recognition Technology