Ranking Sentences for Extractive Summarization with Reinforcement Learning

Shashi Narayan, Shay B. Cohen, Mirella Lapata

2018-02-23NAACL 2018 6Reinforcement Learning Extractive Text Summarization Document Summarization Extractive Summarization reinforcement-learning

Paper PDF Code(official)

Abstract

Single document summarization is the task of producing a shorter version of a document while preserving its principal information content. In this paper we conceptualize extractive summarization as a sentence ranking task and propose a novel training algorithm which globally optimizes the ROUGE evaluation metric through a reinforcement learning objective. We use our algorithm to train a neural summarization model on the CNN and DailyMail datasets and demonstrate experimentally that it outperforms state-of-the-art extractive and abstractive systems when evaluated automatically and by humans.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	CNN / Daily Mail	ROUGE-1	40	REFRESH
Text Summarization	CNN / Daily Mail	ROUGE-2	18.2	REFRESH
Text Summarization	CNN / Daily Mail	ROUGE-L	36.6	REFRESH
Extractive Text Summarization	CNN / Daily Mail	ROUGE-1	40	REFRESH
Extractive Text Summarization	CNN / Daily Mail	ROUGE-2	18.2	REFRESH
Extractive Text Summarization	CNN / Daily Mail	ROUGE-L	36.6	REFRESH

Related Papers

CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning2025-07-18 VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning2025-07-17 Spectral Bellman Method: Unifying Representation and Exploration in RL2025-07-17 Aligning Humans and Robots via Reinforcement Learning from Implicit Human Feedback2025-07-17 VAR-MATH: Probing True Mathematical Reasoning in Large Language Models via Symbolic Multi-Instance Benchmarks2025-07-17 QuestA: Expanding Reasoning Capacity in LLMs via Question Augmentation2025-07-17 Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities2025-07-17 Autonomous Resource Management in Microservice Systems via Reinforcement Learning2025-07-17