Data Augmentation for Voiceprint Recognition Using Generative Adversarial Networks

Yao-San Lin; Hung-Yu Chen; Mei‐Ling Huang; Tsung-Yu Hsieh

doi:10.3390/a17120583

ScienceGate Book Chapters

JOURNAL ARTICLE

Data Augmentation for Voiceprint Recognition Using Generative Adversarial Networks

Yao-San Lin Hung-Yu Chen Mei‐Ling Huang Tsung-Yu Hsieh

Year: 2024 Journal: Algorithms Vol: 17 (12)Pages: 583-583 Publisher: Multidisciplinary Digital Publishing Institute

DOI: 10.3390/a17120583

Get Full-Text PDF Get Analytical Report

Abstract

Voiceprint recognition systems often face challenges related to limited and diverse datasets, which hinder their performance and generalization capabilities. This study proposes a novel approach that integrates generative adversarial networks (GANs) for data augmentation and convolutional neural networks (CNNs) with mel-frequency cepstral coefficients (MFCCs) for voiceprint classification. Experimental results demonstrate that the proposed methodology improves recognition accuracy by up to 15% in low-resource scenarios. The optimal ratio of real-to-GAN-generated samples was determined to be 3:2, which balanced dataset diversity and model performance. In specific cases, the model achieved an accuracy of 96.6%, showcasing its effectiveness in capturing unique voice characteristics while mitigating overfitting. These results highlight the potential of combining GAN-augmented data and CNN-based classification to enhance voiceprint recognition in diverse and resource-constrained environments.

Keywords:

Adversarial system Generative grammar Computer science Artificial intelligence Generative adversarial network Pattern recognition (psychology) Machine learning Deep learning

Metrics

Cited By

0.71

FWCI (Field Weighted Citation Impact)

Refs

0.64

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Speech and Audio Processing

Physical Sciences → Computer Science → Signal Processing

Speech Recognition and Synthesis

Physical Sciences → Computer Science → Artificial Intelligence

Face recognition and analysis

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Data Augmentation for Voiceprint Recognition Using Generative Adversarial Networks

Abstract

Metrics

Citation History

Topics

Related Documents

Data augmentation using generative adversarial networks for robust speech recognition

Data augmentation for handwritten digit recognition using generative adversarial networks

HRRP Data Augmentation Using Generative Adversarial Networks

DATA AUGMENTATION METHOD USING GENERATIVE ADVERSARIAL NETWORKS

Data Augmentation for EEG-Based Emotion Recognition Using Generative Adversarial Networks