{gqa} (single model)

Reported on 2 benchmarks across 1 task

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Natural Language Processing2 results

Question AnsweringonSQuAD1.1
EM
77.09
best: 90.622 ({ANNA} (single model))
Question AnsweringonSQuAD1.1
F1
83.931
best: 95.719 ({ANNA} (single model))