Common Sense Reasoning on SWAG

Metric: Test (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Test▼	Extra Data	Paper	Date↕	Code
1	DeBERTalarge	90.8	No	DeBERTa: Decoding-enhanced BERT with Disentangle...	2020-06-05	Code
2	RoBERTa	89.9	No	RoBERTa: A Robustly Optimized BERT Pretraining A...	2019-07-26	Code
3	BERT-LARGE	86.3	No	BERT: Pre-training of Deep Bidirectional Transfo...	2018-10-11	Code
4	ESIM + ELMo	59.2	No	SWAG: A Large-Scale Adversarial Dataset for Grou...	2018-08-16	-
5	ESIM + GloVe	52.7	No	SWAG: A Large-Scale Adversarial Dataset for Grou...	2018-08-16	-

#1DeBERTalargeSOTA
90.8
Test· 2020-06-05
DeBERTa: Decoding-enhanced BERT with Disentangled Attention Code
#2RoBERTaSOTA
89.9
Test· 2019-07-26
RoBERTa: A Robustly Optimized BERT Pretraining Approach Code
#3BERT-LARGESOTA
86.3
Test· 2018-10-11
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Code
#4ESIM + ELMoSOTA
59.2
Test· 2018-08-16
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference
#5ESIM + GloVe
52.7
Test· 2018-08-16
SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference