Bipartite Graph Pre-training for Unsupervised Extractive Summarization with Graph Convolutional Auto-Encoders

Qianren Mao; Shaobo Zhao; Jiarui Li; Xiaolei Gu; Shizhu He; Bo Li; Jianxin Li

doi:10.18653/v1/2023.findings-emnlp.328

ScienceGate Book Chapters

JOURNAL ARTICLE

Bipartite Graph Pre-training for Unsupervised Extractive Summarization with Graph Convolutional Auto-Encoders

Qianren Mao Shaobo Zhao Jiarui Li Xiaolei Gu Shizhu He Bo Li Jianxin Li

Year: 2023 Pages: 4929-4941

DOI: 10.18653/v1/2023.findings-emnlp.328

Get Full-Text PDF Get Analytical Report

Abstract

Pre-trained sentence representations are crucial for identifying significant sentences in unsupervised document extractive summarization. However, the traditional two-step paradigm of pre-training and sentence-ranking, creates a gap due to differing optimization objectives. To address this issue, we argue that utilizing pre-trained embeddings derived from a process specifically designed to optimize informative and distinctive sentence representations helps rank significant sentences. To do so, we propose a novel graph pre-training auto-encoder to obtain sentence embeddings by explicitly modelling intra-sentential distinctive features and inter-sentential cohesive features through sentence-word bipartite graphs. These fine-tuned sentence embeddings are then utilized in a graph-based ranking algorithm for unsupervised summarization. Our method is a plug-and-play pre-trained model that produces predominant performance for unsupervised summarization frameworks by providing summary-worthy sentence representations. It surpasses heavy BERT- or RoBERTa-based sentence representations in downstream tasks.

Keywords:

Automatic summarization Sentence Computer science Bipartite graph Artificial intelligence Natural language processing Graph Encoder Rank (graph theory) Autoencoder Deep learning Theoretical computer science Mathematics

Metrics

Cited By

0.77

FWCI (Field Weighted Citation Impact)

Refs

0.74

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Advanced Text Analysis Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Bipartite Graph Pre-training for Unsupervised Extractive Summarization with Graph Convolutional Auto-Encoders

Abstract

Metrics

Citation History

Topics

Related Documents

Unsupervised Extractive Summarization With Heterogeneous Graph Embeddings for Chinese Documents

Combining Graph Degeneracy and Submodularity for Unsupervised Extractive Summarization

Extractive Text Summarization Using Deep Auto-encoders

Directed Graph Auto-Encoders

Unsupervised Belief Representation Learning with Information-Theoretic Variational Graph Auto-Encoders