Open-Domain Question Answering on KILT: ELI5

Metric: F1 (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	F1▼	Extra Data	Paper	Date↕	Code
1	somebody	27.13	No	-	-	-
2	arxiv.org/abs/2103.06332	22.88	No	Hurdles to Progress in Long-form Question Answer...	2021-03-10	Code
3	Training Set Retrieval (top 1)	21.62	No	-	-	-
4	BART	19.23	No	-	-	-
5	BART + DPR	17.88	No	-	-	-
6	Random Training Set Answer	17.07	No	-	-	-
7	multi-task small	16.4	No	-	-	-
8	T5-base	16.1	No	KILT: a Benchmark for Knowledge Intensive Langua...	2020-09-04	Code
9	Wikipedia	15.91	No	-	-	-
10	Sphere	15.29	No	-	-	-
11	Input Copying	14.8	No	-	-	-
12	RAG	14.51	No	KILT: a Benchmark for Knowledge Intensive Langua...	2020-09-04	Code
13	TABi	0	No	-	-	-
14	chriskuei	0	No	-	-	-
15	GENRE	0	No	-	-	-
16	Multi-task DPR	0	No	-	-	-

#1somebody
27.13
F1
No paper
#2arxiv.org/abs/2103.06332SOTA
22.88
F1· 2021-03-10
Hurdles to Progress in Long-form Question Answering Code
#3Training Set Retrieval (top 1)
21.62
F1
No paper
#4BART
19.23
F1
No paper
#5BART + DPR
17.88
F1
No paper
#6Random Training Set Answer
17.07
F1
No paper
#7multi-task small
16.4
F1
No paper
#8T5-baseSOTA
16.1
F1· 2020-09-04
KILT: a Benchmark for Knowledge Intensive Language Tasks Code
#9Wikipedia
15.91
F1
No paper
#10Sphere
15.29
F1
No paper
#11Input Copying
14.8
F1
No paper
#12RAG
14.51
F1· 2020-09-04
KILT: a Benchmark for Knowledge Intensive Language Tasks Code
#13TABi
0
F1
No paper
#14chriskuei
0
F1
No paper
#15GENRE
0
F1
No paper
#16Multi-task DPR
0
F1
No paper