Mistral 7B (5-shot)

Reported on 4 benchmarks across 3 tasks · 2 papers

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Methodology4 results

Transfer LearningonMML
Average (%)· uses extra data· 2024-01-08
62.5
best: 87 (GPT-4 o1(300b))
Mixtral of Experts arXiv:2401.04088
Multi-Task LearningonMML
Average (%)· uses extra data· 2024-01-08
62.5
best: 87 (GPT-4 o1(300b))
Mixtral of Experts arXiv:2401.04088
Transfer LearningonMML
Average (%)· 2023-10-10
60.1
best: 87 (GPT-4 o1(300b))
Mistral 7B arXiv:2310.06825
Multi-Task LearningonMML
Average (%)· 2023-10-10
60.1
best: 87 (GPT-4 o1(300b))
Mistral 7B arXiv:2310.06825

Question AnsweringonNatural Questions
EM· 2023-10-10
28.8
best: 64 (Atlas (full, Wiki-dec-2018 index))
Mistral 7B arXiv:2310.06825
Question AnsweringonTriviaQA
EM· 2023-10-10
69.9
best: 87.5 (Claude 2 (few-shot, k=5))
Mistral 7B arXiv:2310.06825