Abstractive Text Summarization with Multi-Head Attention

Jinpeng Li; Chuang Zhang; Xiaojun Chen; Yanan Cao; Pengcheng Liao; Peng Zhang

doi:10.1109/ijcnn.2019.8851885

ScienceGate Book Chapters

JOURNAL ARTICLE

Abstractive Text Summarization with Multi-Head Attention

Jinpeng Li Chuang Zhang Xiaojun Chen Yanan Cao Pengcheng Liao Peng Zhang

Year: 2019 Pages: 1-8

DOI: 10.1109/ijcnn.2019.8851885

Get Full-Text PDF Get Analytical Report

Abstract

In this paper, we present a novel sequence-to-sequence architecture with multi-head attention for automatic summarization of long text. Summaries generated by previous abstractive methods have the problems of duplicate and missing original information commonly. To address these problems, we propose a multi-head attention summarization (MHAS) model, which uses multi-head attention mechanism to learn relevant information in different representation subspaces. The MHAS model can consider the previously predicted words when generating new words to avoid generating a summary of redundant repetition words. And it can learn the internal structure of the article by adding self-attention layer to the traditional encoder and decoder and make the model better preserve the original information. We also integrate the multi-head attention distribution into pointer network creatively to improve the performance of the model. Experiments are conducted on CNN/Daily Mail dataset, which is a long text English corpora. Experimental results show that our proposed model outperforms the previous extractive and abstractive models.

Keywords:

Automatic summarization Computer science Natural language processing Artificial intelligence Pointer (user interface) Encoder Representation (politics) Sequence (biology) Head (geology) Information retrieval

Metrics

Cited By

1.38

FWCI (Field Weighted Citation Impact)

Refs

0.85

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Advanced Text Analysis Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Abstractive Text Summarization with Multi-Head Attention

Abstract

Metrics

Citation History

Topics

Related Documents

Optimized dynamic multi-head attention for abstractive text summarization

VATMAN : Video-Audio-Text Multimodal Abstractive Summarization with Trimodal Hierarchical Multi-head Attention

Exploiting Multi-layer Interactive Attention for Abstractive Text Summarization

Selective and Coverage Multi-head Attention for Abstractive Summarization

Attention history-based attention for abstractive text summarization