Optimizing Heart Disease Prediction with Random Forest and Ensemble Methods

Imran Amin; Setyawan Wibisono; Endang Lestariningsih; Muhammad Lutfi

doi:10.31154/cogito.v11i1.782.80-90

ScienceGate Book Chapters

JOURNAL ARTICLE

Optimizing Heart Disease Prediction with Random Forest and Ensemble Methods

Imran Amin Setyawan Wibisono Endang Lestariningsih Muhammad Lutfi

Year: 2025 Journal: CogITo Smart Journal Vol: 11 (1)Pages: 80-90 Publisher: Mount Klabat College

DOI: 10.31154/cogito.v11i1.782.80-90

Get Full-Text PDF Get Analytical Report

Abstract

This study evaluates ensemble learning techniques for optimizing heart disease prediction, with a focus on Random Forest due to its robustness in handling complex medical data. The dataset used, "Heart Disease Prediction Dataset" from Kaggle, consists of 270 instances and 13 features like age, cholesterol, and family history. Data preprocessing involved mean imputation for missing values and min-max normalization. The study compares Random Forest with other ensemble classifiers—AdaBoost, Gradient Boosting, and XGBoost—using 10-fold cross-validation and evaluation metrics such as accuracy, precision, recall, and F1 score. Results show that Random Forest outperforms the other models with an accuracy of 87.04%, precision of 85.00%, recall of 80.95%, and F1 score of 82.93%. These findings emphasize Random Forest's ability to maintain prediction stability across various medical attributes and imbalanced data. Although the study highlights Random Forest as a promising method for early heart disease risk prediction, it remains a computational evaluation and requires clinical validation. The results aim to inform the development of predictive tools for enhancing early diagnosis and preventive strategies in healthcare systems.

Keywords:

Random forest Ensemble learning Computer science AdaBoost Artificial intelligence Boosting (machine learning) Machine learning Normalization (sociology) Imputation (statistics) Preprocessor Predictive modelling Ensemble forecasting Data mining Missing data Support vector machine

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.35

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Artificial Intelligence in Healthcare

Health Sciences → Health Professions → Health Information Management

Optimizing Heart Disease Prediction with Random Forest and Ensemble Methods

Abstract

Metrics

Topics

Related Documents

Enhanced Heart Disease Prediction Through Optimized Ensemble Random Forest Model

Optimizing Heart Disease Prediction with Hybrid Ensemble Learning

Optimizing Heart Disease Prediction with Random Forest: Insights from the Kaggle Dataset

Naive Bayes - Random Forest Ensemble Model Analysis and Heart Disease Prediction

Heart Disease Prediction Using Machine Learning Model Ensemble-Random Forest with Simple Regression