Bias Detection on StereoSet

Metric: ICAT Score (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	ICAT Score▼	Extra Data	Paper	Date↕	Code
1	GPT-2 (small)	72.97	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
2	XLNet (large)	72.03	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
3	GPT-2 (medium)	71.73	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
4	BERT (base)	71.21	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
5	GPT-2 (large)	70.54	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
6	BERT (large)	69.89	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
7	RoBERTa (base)	67.5	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
8	GAL 120B	65.6	No	Galactica: A Large Language Model for Science	2022-11-16	Code
9	XLNet (base)	62.1	No	StereoSet: Measuring stereotypical bias in pretr...	2020-04-20	Code
10	GPT-3 (text-davinci-002)	60.8	No	Galactica: A Large Language Model for Science	2022-11-16	Code
11	OPT 175B	60	No	Galactica: A Large Language Model for Science	2022-11-16	Code

#1GPT-2 (small)SOTA
72.97
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#2XLNet (large)
72.03
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#3GPT-2 (medium)
71.73
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#4BERT (base)
71.21
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#5GPT-2 (large)
70.54
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#6BERT (large)
69.89
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#7RoBERTa (base)
67.5
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#8GAL 120B
65.6
ICAT Score· 2022-11-16
Galactica: A Large Language Model for Science Code
#9XLNet (base)
62.1
ICAT Score· 2020-04-20
StereoSet: Measuring stereotypical bias in pretrained language models Code
#10GPT-3 (text-davinci-002)
60.8
ICAT Score· 2022-11-16
Galactica: A Large Language Model for Science Code
#11OPT 175B
60
ICAT Score· 2022-11-16
Galactica: A Large Language Model for Science Code