Dialogue Evaluation on USR-TopicalChat

Metric: Pearson Correlation (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Pearson Correlation▼	Extra Data	Paper	Date↕	Code
1	Lin-Reg (all)	0.4974	No	-	-	Code
2	MDD-Eval	0.4575	No	MDD-Eval: Self-Training on Augmented Data for Mu...	2021-12-14	Code
3	USR	0.422	No	USR: An Unsupervised and Reference Free Evaluati...	2020-05-01	Code
4	USR - DR (x = c)	0.4068	No	USR: An Unsupervised and Reference Free Evaluati...	2020-05-01	Code
5	USR - MLM	0.3345	No	USR: An Unsupervised and Reference Free Evaluati...	2020-05-01	Code
6	USR - DR (x = f)	0.3221	No	USR: An Unsupervised and Reference Free Evaluati...	2020-05-01	Code

#1Lin-Reg (all)
0.4974
Pearson Correlation
No paperCode
#2MDD-EvalSOTA
0.4575
Pearson Correlation· 2021-12-14
MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation Code
#3USRSOTA
0.422
Pearson Correlation· 2020-05-01
USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation Code
#4USR - DR (x = c)
0.4068
Pearson Correlation· 2020-05-01
USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation Code
#5USR - MLM
0.3345
Pearson Correlation· 2020-05-01
USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation Code
#6USR - DR (x = f)
0.3221
Pearson Correlation· 2020-05-01
USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation Code