On Extractive and Abstractive Neural Document Summarization with Transformer Language Models

Sandeep Subramanian, Raymond Li, Jonathan Pilault, Christopher Pal

2019-09-07EMNLP 2020 11Abstractive Text Summarization Text Summarization Document Summarization Language Modelling

Abstract

We present a method to produce abstractive summaries of long documents that exceed several thousand words via neural abstractive summarization. We perform a simple extractive step before generating a summary, which is then used to condition the transformer language model on relevant information before being tasked with generating a summary. We show that this extractive step significantly improves summarization results. We also show that this approach produces more abstractive summaries compared to prior work that employs a copy mechanism while still achieving higher rouge scores. Note: The abstract above was not written by the authors, it was generated by one of the models presented in this paper.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	Arxiv HEP-TH citation graph	ROUGE-1	42.43	TLM-I+E
Text Summarization	Arxiv HEP-TH citation graph	ROUGE-1	42.32	Sent-PTR
Text Summarization	Arxiv HEP-TH citation graph	ROUGE-1	34.01	Sent-CLF
Text Summarization	Pubmed	ROUGE-1	45.01	Sent-CLF
Text Summarization	Pubmed	ROUGE-1	43.3	Sent-PTR
Text Summarization	Pubmed	ROUGE-1	41.43	TLM-I+E

Related Papers

Visual-Language Model Knowledge Distillation Method for Image Quality Assessment2025-07-21 Making Language Model a Hierarchical Classifier and Generator2025-07-17 VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning2025-07-17 The Generative Energy Arena (GEA): Incorporating Energy Awareness in Large Language Model (LLM) Human Evaluations2025-07-17 Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities2025-07-17 Assay2Mol: large language model-based drug design using BioAssay context2025-07-16 Describe Anything Model for Visual Question Answering on Text-rich Images2025-07-16 InstructFLIP: Exploring Unified Vision-Language Model for Face Anti-spoofing2025-07-16