Reading Comprehension on BIG-bench

Metric: Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

#	Model↕	Accuracy▼	Extra Data	Paper	Date↕	Code
1	Chinchilla-70B (few-shot, k=5)	78	No	Training Compute-Optimal Large Language Models	2022-03-29	Code
2	Chinchilla-70B (few-shot, k=5)	75	No	Training Compute-Optimal Large Language Models	2022-03-29	Code
3	Gopher-280B (few-shot, k=5)	71.6	No	Scaling Language Models: Methods, Analysis & Ins...	2021-12-08	Code
4	Gopher-280B (few-shot, k=5)	62	No	Scaling Language Models: Methods, Analysis & Ins...	2021-12-08	Code
5	Gopher-280B (few-shot, k=5)	61.4	No	Scaling Language Models: Methods, Analysis & Ins...	2021-12-08	Code
6	Chinchilla-70B (few-shot, k=5)	52.6	No	Training Compute-Optimal Large Language Models	2022-03-29	Code
7	Gopher-280B (few-shot, k=5)	41.4	No	Scaling Language Models: Methods, Analysis & Ins...	2021-12-08	Code