Question Answering on MMLU (Formal Logic)

Metric: Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Accuracy▼	Extra Data	Paper	Date↕	Code
1	Gopher (few-shot, k=5)	35.7	No	Galactica: A Large Language Model for Science	2022-11-16	Code
2	Chinchilla (few-shot, k=5)	33.3	No	Galactica: A Large Language Model for Science	2022-11-16	Code
3	GAL 120B (zero-shot)	32.5	No	Galactica: A Large Language Model for Science	2022-11-16	Code
4	OPT (few-shot, k=5)	29.4	No	Galactica: A Large Language Model for Science	2022-11-16	Code
5	BLOOM (few-shot, k=5)	26.2	No	Galactica: A Large Language Model for Science	2022-11-16	Code

#1Gopher (few-shot, k=5)SOTA
35.7
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#2Chinchilla (few-shot, k=5)
33.3
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#3GAL 120B (zero-shot)
32.5
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#4OPT (few-shot, k=5)
29.4
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#5BLOOM (few-shot, k=5)
26.2
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code