Frequent term based text document clustering using similarity measures: A novel approach

Vijay Kumar Gupta; Maitreyee Dutta; Manoj Kumar

doi:10.1109/iciip.2017.8313704

ScienceGate Book Chapters

JOURNAL ARTICLE

Frequent term based text document clustering using similarity measures: A novel approach

Vijay Kumar Gupta Maitreyee Dutta Manoj Kumar

Year: 2017 Vol: 16 Pages: 1-6

DOI: 10.1109/iciip.2017.8313704

Get Full-Text PDF Get Analytical Report

Abstract

Clustering is one of the epic and traditional ways to make sure that the documents are retrieved at the right pace and according to the requirement. Clustering leads to keeping the similar kind of documents all together and so that they can be retrieved easily. The measure through which the relation between two documents is measured is called similarity index. There are several kind of similarity index already in the process. The proposed algorithm uses two kind of similarity index and combines them to produce a new similarity index. Similarity index plays a vital role in the clustering and classification procedure. The proposed algorithm also uses Fuzzy logic for the clustering rules and furthermore it is classified by the Support Vector Machine to justify the accuracy of the proposed solution.

Keywords:

Cluster analysis Computer science Fuzzy clustering Similarity (geometry) Data mining Index (typography) Similarity measure Term (time) Document clustering Fuzzy logic Relation (database) Artificial intelligence Pattern recognition (psychology)

Metrics

Cited By

0.23

FWCI (Field Weighted Citation Impact)

Refs

0.65

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Advanced Clustering Algorithms Research

Physical Sciences → Computer Science → Artificial Intelligence

Text and Document Classification Technologies

Physical Sciences → Computer Science → Artificial Intelligence

Face and Expression Recognition

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Frequent term based text document clustering using similarity measures: A novel approach

Abstract

Metrics

Citation History

Topics

Related Documents

A frequent term based text clustering approach using novel similarity measure

Frequent term based text document clustering: A new approach

Medical Document Clustering Using Ontology-Based Term Similarity Measures

Medical Document Clustering Using Ontology-Based Term Similarity Measures

Medical Document Clustering Using Ontology-Based Term Similarity Measures