JOURNAL ARTICLE

MULTI-DOCUMENT SUMMARIZATION BASED ON SENTENCE CLUSTERING IMPROVED USING TOPIC WORDS

Indra LukmanaDaniel SwanjayaArrie KurniawardhaniAgus Zainal ArifinDiana Purwitasari

Year: 2014 Journal:   JUTI Jurnal Ilmiah Teknologi Informasi Pages: 1-8   Publisher: Sepuluh Nopember Institute of Technology

Abstract

Informasi dalam bentuk teks berita telah menjadi salah satu komoditas yang paling penting dalam era informasi ini. Ada banyak berita yang dihasilkan sehari-hari, tetapi berita-berita ini sering memberikan konten kontekstual yang sama dengan narasi berbeda. Oleh karena itu, diperlukan metode untuk mengumpulkan informasi ini ke dalam ringkasan sederhana. Di antara sejumlah subtugas yang terlibat dalam peringkasan multi-dokumen termasuk ekstraksi kalimat, deteksi topik, ekstraksi kalimat representatif, dan kalimat rep-resentatif. Dalam tulisan ini, kami mengusulkan metode baru untuk merepresentasikan kalimat ber-dasarkan kata kunci dari topic teks menggunakan Latent Dirichlet Allocation (LDA). Metode ini terdiri dari tiga langkah dasar. Pertama, kami mengelompokkan kalimat di set dokumen menggunakan kesamaan histogram pengelompokan (SHC). Selanjutnya, peringkat cluster menggunakan klaster penting. Terakhir, kalimat perwakilan yang dipilih oleh topik diidentifikasi pada LDA. Metode yang diusulkan diuji pada dataset DUC2004. Hasil penelitian menunjukkan rata-rata 0,3419 dan 0,0766 untuk ROUGE-1 dan ROUGE-2, masing-masing. Selain itu, dari pembaca prespective, metode kami diusulkan menyajikan pengaturan yang koheren dan baik dalam memesan kalimat representatif, sehingga dapat mempermudah pemahaman bacaan dan mengurangi waktu yang dibutuhkan untuk membaca ringkasan.

Keywords:
Automatic summarization Computer science Multi-document summarization Sentence Cluster analysis Natural language processing Document clustering Information retrieval Artificial intelligence

Metrics

4
Cited By
0.97
FWCI (Field Weighted Citation Impact)
12
Refs
0.82
Citation Normalized Percentile
Is in top 1%
Is in top 10%

Citation History

Topics

Edcuational Technology Systems
Physical Sciences →  Computer Science →  Artificial Intelligence
Educational Methods and Media Use
Physical Sciences →  Computer Science →  Information Systems
Multimedia Learning Systems
Physical Sciences →  Computer Science →  Information Systems

Related Documents

JOURNAL ARTICLE

Document Summarization Using Sentence Based Topic Modeling And Clustering

George, AugustineDr. Hanumanthappa.

Journal:   Zenodo (CERN European Organization for Nuclear Research) Year: 2018
JOURNAL ARTICLE

DOCUMENT SUMMARIZATION USING SENTENCE BASED TOPIC MODELING AND CLUSTERING

Augustine Georgea Hanumanthappa

Journal:   International Journal of Advanced Research Year: 2018 Vol: 6 (5)Pages: 285-291
JOURNAL ARTICLE

Document Summarization Using Sentence Based Topic Modeling And Clustering

Augustine GeorgeHanumanthappa.

Journal:   Zenodo (CERN European Organization for Nuclear Research) Year: 2018
© 2026 ScienceGate Book Chapters — All rights reserved.