Fine-tune BERT for Extractive Summarization

Yang Liu

2019-03-25arXiv 2019 3Extractive Text Summarization Extractive Summarization Extractive Document Summarization

Paper PDF Code Code Code Code Code Code Code Code Code Code(official)Code Code

Abstract

BERT, a pre-trained Transformer model, has achieved ground-breaking performance on multiple NLP tasks. In this paper, we describe BERTSUM, a simple variant of BERT, for extractive summarization. Our system is the state of the art on the CNN/Dailymail dataset, outperforming the previous best-performed system by 1.65 on ROUGE-L. The codes to reproduce our results are available at https://github.com/nlpyang/BertSum

Results

Task	Dataset	Metric	Value	Model
Text Summarization	CNN / Daily Mail	ROUGE-1	43.25	BERTSUM+Transformer
Text Summarization	CNN / Daily Mail	ROUGE-2	20.24	BERTSUM+Transformer
Text Summarization	CNN / Daily Mail	ROUGE-L	39.63	BERTSUM+Transformer
Document Summarization	CNN / Daily Mail	ROUGE-1	43.25	BERTSUM+Transformer
Document Summarization	CNN / Daily Mail	ROUGE-2	20.24	BERTSUM+Transformer
Document Summarization	CNN / Daily Mail	ROUGE-L	39.63	BERTSUM+Transformer

Related Papers

StrucSum: Graph-Structured Reasoning for Long Document Extractive Summarization with LLMs2025-05-29 SafeChat: A Framework for Building Trustworthy Collaborative Assistants and a Case Study of its Usefulness2025-04-08 Advancements in Natural Language Processing for Automatic Text Summarization2025-02-27 OrderSum: Semantic Sentence Ordering for Extractive Summarization2025-02-22 Lotus: Creating Short Videos From Long Videos With Abstractive and Extractive Summarization2025-02-10 State Space Models for Extractive Summarization in Low Resource Scenarios2025-01-24 CHIMA: Headline-Guided Extractive Summarization for Thai News Articles2024-12-02 A Novel Word Pair-based Gaussian Sentence Similarity Algorithm For Bengali Extractive Text Summarization2024-11-26