Transformers are Short Text Classifiers: A Study of Inductive Short Text Classifiers on Benchmarks and Real-world Datasets

Fabian Karl, Ansgar Scherp

2022-11-30Text Classification text-classification Classification

Abstract

Short text classification is a crucial and challenging aspect of Natural Language Processing. For this reason, there are numerous highly specialized short text classifiers. However, in recent short text research, State of the Art (SOTA) methods for traditional text classification, particularly the pure use of Transformers, have been unexploited. In this work, we examine the performance of a variety of short text classifiers as well as the top performing traditional text classifier. We further investigate the effects on two new real-world short text datasets in an effort to address the issue of becoming overly dependent on benchmark datasets with a limited number of characteristics. Our experiments unambiguously demonstrate that Transformers achieve SOTA accuracy on short text classification tasks, raising the question of whether specialized short text techniques are necessary.

Results

Task	Dataset	Metric	Value	Model
Text Classification	R8	Accuracy	98.451	DeBERTa
Text Classification	R8	Accuracy	98.28	C-BERT (ESGNN + BERT)
Text Classification	R8	Accuracy	98.23	ESGNN
Text Classification	R8	Accuracy	98.171	BERT
Text Classification	R8	Accuracy	98.09	SGNN
Text Classification	R8	Accuracy	98.041	ERNIE 2.0
Text Classification	R8	Accuracy	97.981	DistilBERT
Text Classification	R8	Accuracy	97.62	ALBERTv2
Text Classification	R8	Accuracy	96.98	WideMLP
Text Classification	R8	Accuracy	96.13	fastText
Text Classification	Searchsnippets	Accuracy	89.69	DistilBERT
Text Classification	Searchsnippets	Accuracy	88.2	BERT
Text Classification	SST-2	Accuracy	94.78	DeBERTa
Text Classification	SST-2	Accuracy	91.37	BERT
Text Classification	NICE-2	Accuracy	99.76	RoBERTa
Text Classification	MR	Accuracy	90.21	DeBERTa
Text Classification	MR	Accuracy	89.53	ERNIE 2.0 (optimized)
Text Classification	MR	Accuracy	89.42	RoBERTa
Text Classification	MR	Accuracy	88.97	ERNIE 2.0
Text Classification	MR	Accuracy	86.94	BERT
Text Classification	MR	Accuracy	86.02	ALBERTv2
Text Classification	MR	Accuracy	85.31	DistilBERT
Text Classification	TREC-10	Accuracy	99.4	BERT
Text Classification	STOPS-41	Accuracy	89.73	DeBERTa
Text Classification	NICE-45	Accuracy	72.79	BERT
Text Classification	Twitter	Accuracy	99.97	ERNIE 2.0
Text Classification	Twitter	Accuracy	99.96	BERT
Text Classification	Twitter	Accuracy	99.96	DistilBERT
Text Classification	STOPS-2	STOPS-2	99.88	ERNIE 2.0
Classification	R8	Accuracy	98.451	DeBERTa
Classification	R8	Accuracy	98.28	C-BERT (ESGNN + BERT)
Classification	R8	Accuracy	98.23	ESGNN
Classification	R8	Accuracy	98.171	BERT
Classification	R8	Accuracy	98.09	SGNN
Classification	R8	Accuracy	98.041	ERNIE 2.0
Classification	R8	Accuracy	97.981	DistilBERT
Classification	R8	Accuracy	97.62	ALBERTv2
Classification	R8	Accuracy	96.98	WideMLP
Classification	R8	Accuracy	96.13	fastText
Classification	Searchsnippets	Accuracy	89.69	DistilBERT
Classification	Searchsnippets	Accuracy	88.2	BERT
Classification	SST-2	Accuracy	94.78	DeBERTa
Classification	SST-2	Accuracy	91.37	BERT
Classification	NICE-2	Accuracy	99.76	RoBERTa
Classification	MR	Accuracy	90.21	DeBERTa
Classification	MR	Accuracy	89.53	ERNIE 2.0 (optimized)
Classification	MR	Accuracy	89.42	RoBERTa
Classification	MR	Accuracy	88.97	ERNIE 2.0
Classification	MR	Accuracy	86.94	BERT
Classification	MR	Accuracy	86.02	ALBERTv2
Classification	MR	Accuracy	85.31	DistilBERT
Classification	TREC-10	Accuracy	99.4	BERT
Classification	STOPS-41	Accuracy	89.73	DeBERTa
Classification	NICE-45	Accuracy	72.79	BERT
Classification	Twitter	Accuracy	99.97	ERNIE 2.0
Classification	Twitter	Accuracy	99.96	BERT
Classification	Twitter	Accuracy	99.96	DistilBERT
Classification	STOPS-2	STOPS-2	99.88	ERNIE 2.0

Abstract

Results

Task	Dataset	Metric	Value	Model
Text Classification	R8	Accuracy	98.451	DeBERTa
Text Classification	R8	Accuracy	98.28	C-BERT (ESGNN + BERT)
Text Classification	R8	Accuracy	98.23	ESGNN
Text Classification	R8	Accuracy	98.171	BERT
Text Classification	R8	Accuracy	98.09	SGNN
Text Classification	R8	Accuracy	98.041	ERNIE 2.0
Text Classification	R8	Accuracy	97.981	DistilBERT
Text Classification	R8	Accuracy	97.62	ALBERTv2
Text Classification	R8	Accuracy	96.98	WideMLP
Text Classification	R8	Accuracy	96.13	fastText
Text Classification	Searchsnippets	Accuracy	89.69	DistilBERT
Text Classification	Searchsnippets	Accuracy	88.2	BERT
Text Classification	SST-2	Accuracy	94.78	DeBERTa
Text Classification	SST-2	Accuracy	91.37	BERT
Text Classification	NICE-2	Accuracy	99.76	RoBERTa
Text Classification	MR	Accuracy	90.21	DeBERTa
Text Classification	MR	Accuracy	89.53	ERNIE 2.0 (optimized)
Text Classification	MR	Accuracy	89.42	RoBERTa
Text Classification	MR	Accuracy	88.97	ERNIE 2.0
Text Classification	MR	Accuracy	86.94	BERT
Text Classification	MR	Accuracy	86.02	ALBERTv2
Text Classification	MR	Accuracy	85.31	DistilBERT
Text Classification	TREC-10	Accuracy	99.4	BERT
Text Classification	STOPS-41	Accuracy	89.73	DeBERTa
Text Classification	NICE-45	Accuracy	72.79	BERT
Text Classification	Twitter	Accuracy	99.97	ERNIE 2.0
Text Classification	Twitter	Accuracy	99.96	BERT
Text Classification	Twitter	Accuracy	99.96	DistilBERT
Text Classification	STOPS-2	STOPS-2	99.88	ERNIE 2.0
Classification	R8	Accuracy	98.451	DeBERTa
Classification	R8	Accuracy	98.28	C-BERT (ESGNN + BERT)
Classification	R8	Accuracy	98.23	ESGNN
Classification	R8	Accuracy	98.171	BERT
Classification	R8	Accuracy	98.09	SGNN
Classification	R8	Accuracy	98.041	ERNIE 2.0
Classification	R8	Accuracy	97.981	DistilBERT
Classification	R8	Accuracy	97.62	ALBERTv2
Classification	R8	Accuracy	96.98	WideMLP
Classification	R8	Accuracy	96.13	fastText
Classification	Searchsnippets	Accuracy	89.69	DistilBERT
Classification	Searchsnippets	Accuracy	88.2	BERT
Classification	SST-2	Accuracy	94.78	DeBERTa
Classification	SST-2	Accuracy	91.37	BERT
Classification	NICE-2	Accuracy	99.76	RoBERTa
Classification	MR	Accuracy	90.21	DeBERTa
Classification	MR	Accuracy	89.53	ERNIE 2.0 (optimized)
Classification	MR	Accuracy	89.42	RoBERTa
Classification	MR	Accuracy	88.97	ERNIE 2.0
Classification	MR	Accuracy	86.94	BERT
Classification	MR	Accuracy	86.02	ALBERTv2
Classification	MR	Accuracy	85.31	DistilBERT
Classification	TREC-10	Accuracy	99.4	BERT
Classification	STOPS-41	Accuracy	89.73	DeBERTa
Classification	NICE-45	Accuracy	72.79	BERT
Classification	Twitter	Accuracy	99.97	ERNIE 2.0
Classification	Twitter	Accuracy	99.96	BERT
Classification	Twitter	Accuracy	99.96	DistilBERT
Classification	STOPS-2	STOPS-2	99.88	ERNIE 2.0

Transformers are Short Text Classifiers: A Study of Inductive Short Text Classifiers on Benchmarks and Real-world Datasets

Abstract

Results

Related Papers

Transformers are Short Text Classifiers: A Study of Inductive Short Text Classifiers on Benchmarks and Real-world Datasets

Abstract

Results

Related Papers