Recovering Capitalization for Automatic Speech Recognition of Vietnamese using Transformer and Chunk Merging

Hiền Nguyễn Thị Thu; Thai Binh Nguyen; Hung Nguyen Vu Bao; Truong Do Quoc; Mai Chi Luong; Huyền Nguyễn Thị Minh

doi:10.1109/kse.2019.8919342

ScienceGate Book Chapters

JOURNAL ARTICLE

Recovering Capitalization for Automatic Speech Recognition of Vietnamese using Transformer and Chunk Merging

Hiền Nguyễn Thị Thu Thai Binh Nguyen Hung Nguyen Vu Bao Truong Do Quoc Mai Chi Luong Huyền Nguyễn Thị Minh

Year: 2019 Pages: 1-5

DOI: 10.1109/kse.2019.8919342

Get Full-Text PDF Get Analytical Report

Abstract

In the last few years, Automatic Speech Recognition (ASR) systems for Vietnamese are utilized in various applications with exceptional results. Nevertheless, such ASR output still contains limitations such as the absence of punctuation, capitalization and standardize numeric data. These shortcomings cause difficulties for readers to understand context efficiently and for Natural Language Processing (NLP) tasks to be well-performed. Capitalization is one of the most critical factors to enhance human readability, parsing, and Named Entity Recognition (NER). Additionally, Vietnamese ASR output has its own features comparing to English such as lisp words, local words, compound words, and homophone. In this paper, we propose a method to Recover Capitalization for long-speech ASR transcription of Vietnamese using Transformer models and chunk merging. Furthermore, we perform decoding in parallel while improving the prediction accuracy.

Keywords:

Computer science Vietnamese Transformer Natural language processing Speech recognition Parsing Artificial intelligence Capitalization Decoding methods Homophone Linguistics Algorithm

Metrics

Cited By

0.77

FWCI (Field Weighted Citation Impact)

Refs

0.79

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Speech Recognition and Synthesis

Physical Sciences → Computer Science → Artificial Intelligence

Recovering Capitalization for Automatic Speech Recognition of Vietnamese using Transformer and Chunk Merging

Abstract

Metrics

Citation History

Topics

Related Documents

Automatic Speech Recognition for Vietnamese Using HTK System

Recovering capitalization and punctuation marks for automatic speech recognition: Case study for Portuguese broadcast news

Recovering punctuation marks for automatic speech recognition

A Survey of Vietnamese Automatic Speech Recognition

Vietnamese Automatic Speech Recognition: The FLaVoR Approach