Logical Reasoning on BIG-bench (Logical Fallacy Detection)

Metric: Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Sort:

#	Model↕	Accuracy▼	Augmentations	Paper	Date↕	Code
1	Chinchilla-70B (few-shot, k=5)	72.1	No	Training Compute-Optimal Large Language Models	2022-03-29	Code
2	Gopher-280B (few-shot, k=5)	58.9	No	Scaling Language Models: Methods, Analysis & Ins...	2021-12-08	Code