Fast-mRMR: Fast Minimum Redundancy Maximum Relevance Algorithm for High-Dimensional Big Data

Sergio Ramírez‐Gallego; Iago Lastra; David Martínez‐Rego; Verónica Bolón‐Canedo; José M. Benítez; Francisco Herrera; Amparo Alonso‐Betanzos

doi:10.1002/int.21833

JOURNAL ARTICLE

Fast-mRMR: Fast Minimum Redundancy Maximum Relevance Algorithm for High-Dimensional Big Data

Sergio Ramírez‐Gallego Iago Lastra David Martínez‐Rego Verónica Bolón‐Canedo José M. Benítez Francisco Herrera Amparo Alonso‐Betanzos

Year: 2016 Journal: International Journal of Intelligent Systems Vol: 32 (2)Pages: 134-152 Publisher: Wiley

DOI: 10.1002/int.21833

Get Full-Text PDF Get Analytical Report

Abstract

With the advent of large-scale problems, feature selection has become a fundamental preprocessing step to reduce input dimensionality. The minimum-redundancy-maximum-relevance (mRMR) selector is considered one of the most relevant methods for dimensionality reduction due to its high accuracy. However, it is a computationally expensive technique, sharply affected by the number of features. This paper presents fast-mRMR, an extension of mRMR, which tries to overcome this computational burden. Associated with fast-mRMR, we include a package with three implementations of this algorithm in several platforms, namely, CPU for sequential execution, GPU (graphics processing units) for parallel computing, and Apache Spark for distributed computing using big data technologies.

Keywords:

Computer science Preprocessor Redundancy (engineering) Dimensionality reduction Curse of dimensionality Relevance (law) Feature selection Implementation Big data SPARK (programming language) Algorithm Parallel computing Data mining Artificial intelligence

Metrics

190

Cited By

7.52

FWCI (Field Weighted Citation Impact)

Refs

0.98

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Advanced Image and Video Retrieval Techniques

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Image Retrieval and Classification Techniques

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Face and Expression Recognition

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Fast-mRMR: Fast Minimum Redundancy Maximum Relevance Algorithm for High-Dimensional Big Data

Abstract

Metrics

Citation History

Topics

Related Documents

Maximum Relevance/Minimum Redundancy (MRMR)

mRMR-Permute: Permutation Testing for Unbiased Minimum Redundancy Maximum Relevance Feature Selection

A New gene selection approach based on Minimum Redundancy-Maximum Relevance (MRMR) and Genetic Algorithm (GA)

Implementation of Minimum Redundancy Maximum Relevance (MRMR) and Genetic Algorithm (GA) for Microarray Data Classification with C4.5 Decision Tree

PREAL: prediction of allergenic protein by maximum Relevance Minimum Redundancy (mRMR) feature selection