Nepali Speech Recognition using RNN-CTC Model

Paribesh Regmi; Arjun Dahal; Basanta Joshi

doi:10.5120/ijca2019918401

ScienceGate Book Chapters

JOURNAL ARTICLE

Nepali Speech Recognition using RNN-CTC Model

Paribesh Regmi Arjun Dahal Basanta Joshi

Year: 2019 Journal: International Journal of Computer Applications Vol: 178 (31)Pages: 1-6

DOI: 10.5120/ijca2019918401

Get Full-Text PDF Get Analytical Report

Abstract

This paper presents a Neural Network based Nepali Speech Recognition model.RNN (Recurrent Neural Networks) is used for processing sequential audio data.CTC (Connectionist Temporal Classification) [1] technique is applied allowing RNN to train over audio data.CTC is a probabilistic approach of maximizing the occurrence probability of the desired labels from RNN output.After processing through RNN and CTC layers, Nepali text is obtained as output.This paper also defines a character set of 67 Nepali characters required for transcription of Nepali speech to text.

Keywords:

Nepali Computer science Speech recognition Artificial intelligence Linguistics

Metrics

Cited By

1.08

FWCI (Field Weighted Citation Impact)

Refs

0.82

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Speech Recognition and Synthesis

Physical Sciences → Computer Science → Artificial Intelligence

Music and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Nepali Speech Recognition using RNN-CTC Model

Abstract

Metrics

Citation History

Topics

Related Documents

LSTM RNN-based Korean Speech Recognition System Using CTC

Training RNN-T with CTC Loss in Automatic Speech Recognition

CTC Regularized Model Adaptation for Improving LSTM RNN Based Multi-Accent Mandarin Speech Recognition

CTC regularized model adaptation for improving LSTM RNN based multi-accent Mandarin speech recognition

Speech Recognition via CTC-CNN Model