Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Models/Human Benchmark

Human Benchmark

Reported on 12 benchmarks across 5 tasks · 1 paper · 10 SOTA

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Natural Language Processing12 results

Question AnsweringonDaNetQA
Accuracy· 2020-10-29
0.915
best: 0.917 (Golden Transformer)
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Common Sense ReasoningonRWSD
Accuracy· 2020-10-29
0.84
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Common Sense ReasoningonPARus
Accuracy· 2020-10-29
0.982
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Common Sense ReasoningonRuCoS
Average F1· 2020-10-29
0.93
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Common Sense ReasoningonRuCoS
EM · 2020-10-29
0.89
best: 0.924 (Golden Transformer)
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Word Sense DisambiguationonRUSSE
Accuracy· 2020-10-29
0.805
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Natural Language InferenceonRCB
Accuracy· 2020-10-29
0.702
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Natural Language InferenceonRCB
Average F1· 2020-10-29
0.68
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Natural Language InferenceonLiDiRus
MCC· 2020-10-29
0.626
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Natural Language InferenceonTERRa
Accuracy· 2020-10-29
0.92
SOTA
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Reading ComprehensiononMuSeRC
Average F1· 2020-10-29
0.806
best: 0.941 (Golden Transformer)
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925
Reading ComprehensiononMuSeRC
EM · 2020-10-29
0.42
best: 0.819 (Golden Transformer)
RussianSuperGLUE: A Russian Language Understanding Evaluation Benchmark arXiv:2010.15925