A Neural Attention Model for Abstractive Sentence Summarization

Alexander M. Rush, Sumit Chopra, Jason Weston

2015-09-02EMNLP 2015 9Extractive Text Summarization Text Summarization

Abstract

Summarization based on text extraction is inherently limited, but generation-style abstractive methods have proven challenging to build. In this work, we propose a fully data-driven approach to abstractive sentence summarization. Our method utilizes a local attention-based model that generates each word of the summary conditioned on the input sentence. While the model is structurally simple, it can easily be trained end-to-end and scales to a large amount of training data. The model shows significant performance gains on the DUC-2004 shared task compared with several strong baselines.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	DUC 2004 Task 1	ROUGE-1	28.18	Abs+
Text Summarization	DUC 2004 Task 1	ROUGE-2	8.49	Abs+
Text Summarization	DUC 2004 Task 1	ROUGE-L	23.81	Abs+
Text Summarization	DUC 2004 Task 1	ROUGE-L	22.05	ABS
Text Summarization	GigaWord	ROUGE-1	31	Abs+
Text Summarization	GigaWord	ROUGE-1	30.88	Abs
Text Summarization	DUC 2004 Task 1	ROUGE-1	26.55	Abs
Text Summarization	DUC 2004 Task 1	ROUGE-2	7.06	Abs
Text Summarization	DUC 2004 Task 1	ROUGE-L	22.05	Abs
Extractive Text Summarization	DUC 2004 Task 1	ROUGE-1	26.55	Abs
Extractive Text Summarization	DUC 2004 Task 1	ROUGE-2	7.06	Abs
Extractive Text Summarization	DUC 2004 Task 1	ROUGE-L	22.05	Abs

Related Papers

LRCTI: A Large Language Model-Based Framework for Multi-Step Evidence Retrieval and Reasoning in Cyber Threat Intelligence Credibility Verification2025-07-15 On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention2025-06-11 Improving large language models with concept-aware fine-tuning2025-06-09 MaCP: Minimal yet Mighty Adaptation via Hierarchical Cosine Projection2025-05-29 APE: A Data-Centric Benchmark for Efficient LLM Adaptation in Text Summarization2025-05-26 FiLLM -- A Filipino-optimized Large Language Model based on Southeast Asia Large Language Model (SEALLM)2025-05-25 Scaling Up Biomedical Vision-Language Models: Fine-Tuning, Instruction Tuning, and Multi-Modal Learning2025-05-23 A Structured Literature Review on Traditional Approaches in Current Natural Language Processing2025-05-19