Question Answering on MMLU (Abstract Algebra)

Metric: Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Accuracy▼	Extra Data	Paper	Date↕	Code
1	GAL 30B (zero-shot)	33.3	No	Galactica: A Large Language Model for Science	2022-11-16	Code
2	Chinchilla (few-shot, k=5)	31	No	Galactica: A Large Language Model for Science	2022-11-16	Code
3	GAL 120B (zero-shot)	27	No	Galactica: A Large Language Model for Science	2022-11-16	Code
4	Gopher (few-shot, k=5)	25	No	Galactica: A Large Language Model for Science	2022-11-16	Code
5	OPT (few-shot, k=5)	21	No	Galactica: A Large Language Model for Science	2022-11-16	Code

#1GAL 30B (zero-shot)SOTA
33.3
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#2Chinchilla (few-shot, k=5)
31
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#3GAL 120B (zero-shot)
27
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#4Gopher (few-shot, k=5)
25
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#5OPT (few-shot, k=5)
21
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code