Extractive Summarization as Text Matching

Ming Zhong, PengFei Liu, Yiran Chen, Danqing Wang, Xipeng Qiu, Xuanjing Huang

2020-04-19ACL 2020 6Text Matching Extractive Text Summarization Text Summarization Document Summarization Extractive Summarization Semantic Text Matching

Paper PDF Code(official)Code

Abstract

This paper creates a paradigm shift with regard to the way we build neural extractive summarization systems. Instead of following the commonly used framework of extracting sentences individually and modeling the relationship between sentences, we formulate the extractive summarization task as a semantic text matching problem, in which a source document and candidate summaries will be (extracted from the original text) matched in a semantic space. Notably, this paradigm shift to semantic matching framework is well-grounded in our comprehensive analysis of the inherent gap between sentence-level and summary-level extractors based on the property of the dataset. Besides, even instantiating the framework with a simple form of a matching model, we have driven the state-of-the-art extractive result on CNN/DailyMail to a new level (44.41 in ROUGE-1). Experiments on the other five datasets also show the effectiveness of the matching framework. We believe the power of this matching-based summarization framework has not been fully exploited. To encourage more instantiations in the future, we have released our codes, processed dataset, as well as generated summaries in https://github.com/maszhongming/MatchSum.

Results

Task	Dataset	Metric	Value	Model
Text Summarization	WikiHow	ROUGE-1	31.85	MatchSum (BERT-base)
Text Summarization	WikiHow	ROUGE-2	8.98	MatchSum (BERT-base)
Text Summarization	WikiHow	ROUGE-L	29.58	MatchSum (BERT-base)
Text Summarization	Reddit TIFU	ROUGE-1	25.09	MatchSum
Text Summarization	Reddit TIFU	ROUGE-2	6.17	MatchSum
Text Summarization	Reddit TIFU	ROUGE-L	20.13	MatchSum
Text Summarization	BBC XSum	ROUGE-1	24.86	MatchSum
Text Summarization	BBC XSum	ROUGE-2	4.66	MatchSum
Text Summarization	BBC XSum	ROUGE-L	18.41	MatchSum
Text Summarization	Pubmed	ROUGE-1	41.21	MatchSum (BERT-base)
Text Summarization	Pubmed	ROUGE-2	14.91	MatchSum (BERT-base)
Text Summarization	Pubmed	ROUGE-L	36.75	MatchSum (BERT-base)
Text Summarization	CNN / Daily Mail	ROUGE-1	44.41	MatchSum (RoBERTa-base)
Text Summarization	CNN / Daily Mail	ROUGE-2	20.86	MatchSum (RoBERTa-base)
Text Summarization	CNN / Daily Mail	ROUGE-L	40.55	MatchSum (RoBERTa-base)
Text Summarization	CNN / Daily Mail	ROUGE-1	44.22	MatchSum (BERT-base)
Text Summarization	CNN / Daily Mail	ROUGE-2	20.62	MatchSum (BERT-base)
Text Summarization	CNN / Daily Mail	ROUGE-L	40.38	MatchSum (BERT-base)
Text Summarization	CNN / Daily Mail	ROUGE-1	44.41	MatchSum
Text Summarization	CNN / Daily Mail	ROUGE-2	20.86	MatchSum
Text Summarization	CNN / Daily Mail	ROUGE-L	40.55	MatchSum
Extractive Text Summarization	CNN / Daily Mail	ROUGE-1	44.41	MatchSum
Extractive Text Summarization	CNN / Daily Mail	ROUGE-2	20.86	MatchSum
Extractive Text Summarization	CNN / Daily Mail	ROUGE-L	40.55	MatchSum
Document Summarization	CNN / Daily Mail	ROUGE-1	44.41	MatchSum (RoBERTa-base)
Document Summarization	CNN / Daily Mail	ROUGE-2	20.86	MatchSum (RoBERTa-base)
Document Summarization	CNN / Daily Mail	ROUGE-L	40.55	MatchSum (RoBERTa-base)
Document Summarization	CNN / Daily Mail	ROUGE-1	44.22	MatchSum (BERT-base)
Document Summarization	CNN / Daily Mail	ROUGE-2	20.62	MatchSum (BERT-base)
Document Summarization	CNN / Daily Mail	ROUGE-L	40.38	MatchSum (BERT-base)

Extractive Summarization as Text Matching

Abstract

Results

Related Papers

Extractive Summarization as Text Matching

Abstract

Results

Related Papers