Deep Communicating Agents for Abstractive Summarization

Asli Celikyilmaz, Antoine Bosselut, Xiaodong He, Yejin Choi

2018-03-27NAACL 2018 6Reinforcement Learning Abstractive Text Summarization reinforcement-learning

Abstract

We present deep communicating agents in an encoder-decoder architecture to address the challenges of representing a long document for abstractive summarization. With deep communicating agents, the task of encoding a long text is divided across multiple collaborating agents, each in charge of a subsection of the input text. These encoders are connected to a single decoder, trained end-to-end using reinforcement learning to generate a focused and coherent summary. Empirical results demonstrate that multiple communicating encoders lead to a higher quality summary compared to several strong baselines, including those based on a single encoder or multiple non-communicating encoders.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	CNN / Daily Mail	ROUGE-1	41.69	DCA
Text Summarization	CNN / Daily Mail	ROUGE-2	19.47	DCA
Text Summarization	CNN / Daily Mail	ROUGE-L	37.92	DCA
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-1	41.69	DCA
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-2	19.47	DCA
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-L	37.92	DCA

Related Papers

CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning2025-07-18 VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning2025-07-17 Spectral Bellman Method: Unifying Representation and Exploration in RL2025-07-17 Aligning Humans and Robots via Reinforcement Learning from Implicit Human Feedback2025-07-17 VAR-MATH: Probing True Mathematical Reasoning in Large Language Models via Symbolic Multi-Instance Benchmarks2025-07-17 QuestA: Expanding Reasoning Capacity in LLMs via Question Augmentation2025-07-17 Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities2025-07-17 Autonomous Resource Management in Microservice Systems via Reinforcement Learning2025-07-17