Question Answering on MedMCQA

Metric: Test Set (Acc-%) (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Test Set (Acc-%)▼	Extra Data	Paper	Date↕	Code
1	Med-PaLM 2 (ER)	0.723	No	Towards Expert-Level Medical Question Answering ...	2023-05-16	Code
2	Med-PaLM 2 (CoT+SC)	0.715	No	Towards Expert-Level Medical Question Answering ...	2023-05-16	Code
3	Med-PaLM 2 (5-shot)	0.713	No	Towards Expert-Level Medical Question Answering ...	2023-05-16	Code
4	VOD (BioLinkBERT)	0.629	No	Variational Open-Domain Question Answering	2022-09-23	Code
5	Codex 5-shot CoT	0.627	No	Can large language models reason about medical q...	2022-07-17	Code
6	BioMedGPT-10B	0.514	No	BioMedGPT: Open Multimodal Generative Pre-traine...	2023-08-18	Code
7	PubmedBERT(Gu et al., 2022)	0.41	No	MedMCQA : A Large-scale Multi-Subject Multi-Choi...	2022-03-27	Code
8	SciBERT (Beltagy et al., 2019)	0.39	No	MedMCQA : A Large-scale Multi-Subject Multi-Choi...	2022-03-27	Code
9	BioBERT (Lee et al.,2020)	0.37	No	MedMCQA : A Large-scale Multi-Subject Multi-Choi...	2022-03-27	Code
10	BERT (Devlin et al., 2019)-Base	0.33	No	MedMCQA : A Large-scale Multi-Subject Multi-Choi...	2022-03-27	Code

#1Med-PaLM 2 (ER)SOTA
0.723
Test Set (Acc-%)· 2023-05-16
Towards Expert-Level Medical Question Answering with Large Language Models Code
#2Med-PaLM 2 (CoT+SC)
0.715
Test Set (Acc-%)· 2023-05-16
Towards Expert-Level Medical Question Answering with Large Language Models Code
#3Med-PaLM 2 (5-shot)
0.713
Test Set (Acc-%)· 2023-05-16
Towards Expert-Level Medical Question Answering with Large Language Models Code
#4VOD (BioLinkBERT)SOTA
0.629
Test Set (Acc-%)· 2022-09-23
Variational Open-Domain Question Answering Code
#5Codex 5-shot CoTSOTA
0.627
Test Set (Acc-%)· 2022-07-17
Can large language models reason about medical questions?Code
#6BioMedGPT-10B
0.514
Test Set (Acc-%)· 2023-08-18
BioMedGPT: Open Multimodal Generative Pre-trained Transformer for BioMedicine Code
#7PubmedBERT(Gu et al., 2022)SOTA
0.41
Test Set (Acc-%)· 2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering Code
#8SciBERT (Beltagy et al., 2019)
0.39
Test Set (Acc-%)· 2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering Code
#9BioBERT (Lee et al.,2020)
0.37
Test Set (Acc-%)· 2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering Code
#10BERT (Devlin et al., 2019)-Base
0.33
Test Set (Acc-%)· 2022-03-27
MedMCQA : A Large-scale Multi-Subject Multi-Choice Dataset for Medical domain Question Answering Code