Question Similarity on Q2Q Arabic Benchmark

Metric: F1 score (higher is better)

LeaderboardDataset

Loading chart...

Results

Sort:

#	Model↕	F1 score▼	Extra Data	Paper	Date↕	Code
1	Ensemble multilingual BERT model	0.95924	No	The Inception Team at NSURL-2019 Task 8: Semanti...	2020-04-24	-
2	Tha3aroon	0.94848	No	Tha3aroon at NSURL-2019 Task 8: Semantic Questio...	2019-12-28	Code
3	mBert	0.8365	No	Deep Learning Models for Multilingual Hate Speec...	2020-04-14	Code