SummaRuNNer: A Recurrent Neural Network based Sequence Model for Extractive Summarization of Documents

Ramesh Nallapati, FeiFei Zhai, Bo-Wen Zhou

2016-11-14Text Summarization Document Summarization Extractive Summarization

Paper PDF Code Code Code Code Code Code Code

Abstract

We present SummaRuNNer, a Recurrent Neural Network (RNN) based sequence model for extractive summarization of documents and show that it achieves performance better than or comparable to state-of-the-art. Our model has the additional advantage of being very interpretable, since it allows visualization of its predictions broken up by abstract features such as information content, salience and novelty. Another novel contribution of our work is abstractive training of our extractive model that can train on human generated reference summaries alone, eliminating the need for sentence-level extractive labels.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-1	39.6	SummaRuNNer
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-2	16.2	SummaRuNNer
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-L	35.3	SummaRuNNer
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-1	39.2	Lead-3 baseline
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-2	15.7	Lead-3 baseline
Text Summarization	CNN / Daily Mail (Anonymized)	ROUGE-L	35.5	Lead-3 baseline

Related Papers

LRCTI: A Large Language Model-Based Framework for Multi-Step Evidence Retrieval and Reasoning in Cyber Threat Intelligence Credibility Verification2025-07-15 GenerationPrograms: Fine-grained Attribution with Executable Programs2025-06-17 Arctic Long Sequence Training: Scalable And Efficient Training For Multi-Million Token Sequences2025-06-16 On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention2025-06-11 Improving large language models with concept-aware fine-tuning2025-06-09 Improving Fairness of Large Language Models in Multi-document Summarization2025-06-09 MaCP: Minimal yet Mighty Adaptation via Hierarchical Cosine Projection2025-05-29 ARC: Argument Representation and Coverage Analysis for Zero-Shot Long Document Summarization with Instruction Following LLMs2025-05-29