Question Answering on MMLU (Astronomy)

Metric: Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Accuracy▼	Extra Data	Paper	Date↕	Code
1	Chinchilla (few-shot, k=5)	73	No	Galactica: A Large Language Model for Science	2022-11-16	Code
2	Gopher (few-shot, k=5)	65.8	No	Galactica: A Large Language Model for Science	2022-11-16	Code
3	GAL 120B (zero-shot)	65.1	No	Galactica: A Large Language Model for Science	2022-11-16	Code
4	BLOOM (few-shot, k=5)	25.7	No	Galactica: A Large Language Model for Science	2022-11-16	Code
5	OPT (few-shot, k=5)	23	No	Galactica: A Large Language Model for Science	2022-11-16	Code

#1Chinchilla (few-shot, k=5)SOTA
73
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#2Gopher (few-shot, k=5)
65.8
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#3GAL 120B (zero-shot)
65.1
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#4BLOOM (few-shot, k=5)
25.7
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code
#5OPT (few-shot, k=5)
23
Accuracy· 2022-11-16
Galactica: A Large Language Model for Science Code