A New Optimal Ensemble Algorithm Based on SVDD Sampling for Imbalanced Data Classification

Jamshid Pirgazi; Abbas Pirmohammadi; Reza Shams

doi:10.1142/s0218001421500208

ScienceGate Book Chapters

JOURNAL ARTICLE

A New Optimal Ensemble Algorithm Based on SVDD Sampling for Imbalanced Data Classification

Jamshid Pirgazi Abbas Pirmohammadi Reza Shams

Year: 2020 Journal: International Journal of Pattern Recognition and Artificial Intelligence Vol: 35 (06)Pages: 2150020-2150020 Publisher: World Scientific

DOI: 10.1142/s0218001421500208

Get Full-Text PDF Get Analytical Report

Abstract

Nowadays, imbalanced data classification is a hot topic in data mining and recently, several valuable researches have been conducted to overcome certain difficulties in the field. Moreover, those approaches, which are based on ensemble classifiers, have achieved reasonable results. Despite the success of these works, there are still many unsolved issues such as disregarding the importance of samples in balancing, determination of proper number of classifiers and optimizing weights of base classifiers in voting stage of ensemble methods. This paper intends to find an admissible solution for these challenges. The solution suggested in this paper applies the support vector data descriptor (SVDD) for sampling both minority and majority classes. After determining the optimal number of base classifiers, the selected samples are utilized to adjust base classifiers. Finally, genetic algorithm optimization is used in order to find the optimum weights of each base classifier in the voting stage. The proposed method is compared with some existing algorithms. The results of experiments confirm its effectiveness.

Keywords:

Computer science Classifier (UML) Random subspace method Weighted voting Support vector machine Majority rule Voting Machine learning Data mining Artificial intelligence Base (topology) Ensemble learning Pattern recognition (psychology) Mathematics

Metrics

Cited By

0.15

FWCI (Field Weighted Citation Impact)

Refs

0.56

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Imbalanced Data Classification Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Electricity Theft Detection Techniques

Physical Sciences → Engineering → Electrical and Electronic Engineering

Machine Learning and Data Classification

Physical Sciences → Computer Science → Artificial Intelligence

A New Optimal Ensemble Algorithm Based on SVDD Sampling for Imbalanced Data Classification

Abstract

Metrics

Citation History

Topics

Related Documents

Imbalanced data ensemble classification based on cluster-based under-sampling algorithm

Imbalanced Data Classification Algorithm Based on Integrated Sampling and Ensemble Learning

Stratified sampling based ensemble classification for imbalanced data

Classification Hardness Based Adaptive Sampling Ensemble for Imbalanced Data Classification

Two-step ensemble under-sampling algorithm for massive imbalanced data classification