Neural Latent Extractive Document Summarization

Xingxing Zhang, Mirella Lapata, Furu Wei, Ming Zhou

2018-08-22EMNLP 2018 10Extractive Text Summarization Document Summarization Extractive Summarization Extractive Document Summarization

Paper PDF

Abstract

Extractive summarization models require sentence-level labels, which are usually created heuristically (e.g., with rule-based methods) given that most summarization datasets only have document-summary pairs. Since these labels might be suboptimal, we propose a latent variable extractive model where sentences are viewed as latent variables and sentences with activated variables are used to infer gold summaries. During training the loss comes \emph{directly} from gold summaries. Experiments on the CNN/Dailymail dataset show that our model improves over a strong extractive baseline trained on heuristically approximated labels and also performs competitively to several recent models.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	CNN / Daily Mail	ROUGE-1	41.05	Latent
Text Summarization	CNN / Daily Mail	ROUGE-2	18.77	Latent
Text Summarization	CNN / Daily Mail	ROUGE-L	37.54	Latent
Extractive Text Summarization	CNN / Daily Mail	ROUGE-1	41.05	Latent
Extractive Text Summarization	CNN / Daily Mail	ROUGE-2	18.77	Latent
Extractive Text Summarization	CNN / Daily Mail	ROUGE-L	37.54	Latent

Related Papers

GenerationPrograms: Fine-grained Attribution with Executable Programs2025-06-17 Arctic Long Sequence Training: Scalable And Efficient Training For Multi-Million Token Sequences2025-06-16 Improving Fairness of Large Language Models in Multi-document Summarization2025-06-09 ARC: Argument Representation and Coverage Analysis for Zero-Shot Long Document Summarization with Instruction Following LLMs2025-05-29 StrucSum: Graph-Structured Reasoning for Long Document Extractive Summarization with LLMs2025-05-29 Ask, Retrieve, Summarize: A Modular Pipeline for Scientific Literature Summarization2025-05-22 Hallucinate at the Last in Long Response Generation: A Case Study on Long Document Summarization2025-05-21 Document Attribution: Examining Citation Relationships using Large Language Models2025-05-09