Document-Specific Keyphrase Extraction Using Sequential Patterns with Wildcards

Fei Xie; Xindong Wu; Xingquan Zhu

doi:10.1109/icdm.2014.105

ScienceGate Book Chapters

JOURNAL ARTICLE

Document-Specific Keyphrase Extraction Using Sequential Patterns with Wildcards

Fei Xie Xindong Wu Xingquan Zhu

Year: 2014 Pages: 1055-1060

DOI: 10.1109/icdm.2014.105

Get Full-Text PDF Get Analytical Report

Abstract

Finding good keyphrases for a document is beneficial for many applications, such as text summarization, browsing, and indexing. In this paper, we propose a sequential pattern mining based document-specific keyphrase extraction method. Our key innovation is to use wildcards (or gap constraints) to help extract sequential patterns, where the flexible wildcard constraints within a pattern can capture semantic relationships between words. To achieve this goal, we regard each single document as a sequential dataset, and propose an efficient algorithm to mine sequential patterns with wildcard and one-off conditions that allows important keyphrases to be captured during the mining process. For each extracted keyphrase candidate, we use some statistical pattern features to characterize it. A supervised learning classifier is trained to identify keyphrases from a test document. Comparisons on keyphrase benchmark datasets confirm that our document-specific keyphrase extraction method is effective in improving the quality of extracted keyphrases.

Keywords:

Computer science Automatic summarization Artificial intelligence Search engine indexing Classifier (UML) Benchmark (surveying) Merge (version control) Information retrieval Natural language processing

Metrics

Cited By

4.35

FWCI (Field Weighted Citation Impact)

Refs

0.94

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Advanced Text Analysis Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Document-Specific Keyphrase Extraction Using Sequential Patterns with Wildcards

Abstract

Metrics

Citation History

Topics

Related Documents

Efficient sequential pattern mining with wildcards for keyphrase extraction

Single-Document Keyphrase Extraction for Multi-Document Keyphrase Extraction

Document Specific Supervised Keyphrase Extraction With Strong Semantic Relations

MAIL: mining sequential patterns with wildcards

Keyphrase Extraction with Sequential Pattern Mining