SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization

Mathieu Ravaut, Shafiq Joty, Nancy F. Chen

2022-03-13ACL 2022 5Abstractive Text Summarization Text Summarization Document Summarization Re-Ranking

Abstract

Sequence-to-sequence neural networks have recently achieved great success in abstractive summarization, especially through fine-tuning large pre-trained language models on the downstream dataset. These models are typically decoded with beam search to generate a unique summary. However, the search space is very large, and with the exposure bias, such decoding is not optimal. In this paper, we show that it is possible to directly train a second-stage model performing re-ranking on a set of summary candidates. Our mixture-of-experts SummaReranker learns to select a better candidate and consistently improves the performance of the base model. With a base PEGASUS, we push ROUGE scores by 5.44% on CNN-DailyMail (47.16 ROUGE-1), 1.31% on XSum (48.12 ROUGE-1) and 9.34% on Reddit TIFU (29.83 ROUGE-1), reaching a new state-of-the-art. Our code and checkpoints will be available at https://github.com/ntunlp/SummaReranker.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	Reddit TIFU	ROUGE-1	29.83	PEGASUS + SummaReranker
Text Summarization	Reddit TIFU	ROUGE-2	9.5	PEGASUS + SummaReranker
Text Summarization	Reddit TIFU	ROUGE-L	23.47	PEGASUS + SummaReranker
Text Summarization	X-Sum	ROUGE-1	48.12	PEGASUS + SummaReranker
Text Summarization	X-Sum	ROUGE-2	24.95	PEGASUS + SummaReranker
Text Summarization	X-Sum	ROUGE-L	40	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-1	47.16	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-2	22.61	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-L	43.87	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-1	47.16	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-2	22.55	PEGASUS + SummaReranker
Text Summarization	CNN / Daily Mail	ROUGE-L	43.87	PEGASUS + SummaReranker
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-1	47.16	PEGASUS + SummaReranker
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-2	22.61	PEGASUS + SummaReranker
Abstractive Text Summarization	CNN / Daily Mail	ROUGE-L	43.87	PEGASUS + SummaReranker
Document Summarization	CNN / Daily Mail	ROUGE-1	47.16	PEGASUS + SummaReranker
Document Summarization	CNN / Daily Mail	ROUGE-2	22.55	PEGASUS + SummaReranker
Document Summarization	CNN / Daily Mail	ROUGE-L	43.87	PEGASUS + SummaReranker

SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization

Abstract

Results

Related Papers

SummaReranker: A Multi-Task Mixture-of-Experts Re-ranking Framework for Abstractive Summarization

Abstract

Results

Related Papers