Image Retrieval on COCO-CN

Metric: R@5 (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	R@5▼	Extra Data	Paper	Date↕	Code
1	CN-CLIP (ViT-B/16)	97.1	No	Chinese CLIP: Contrastive Vision-Language Pretra...	2022-11-02	Code
2	CN-CLIP (ViT-H/14)	96.9	No	Chinese CLIP: Contrastive Vision-Language Pretra...	2022-11-02	Code
3	CN-CLIP (ViT-L/14@336px)	96.7	No	Chinese CLIP: Contrastive Vision-Language Pretra...	2022-11-02	Code
4	R2D2 (ViT-L/14)	96.5	No	CCMB: A Large-scale Chinese Cross-modal Benchmark	2022-05-08	Code
5	CN-CLIP (ViT-L/14)	96.3	No	Chinese CLIP: Contrastive Vision-Language Pretra...	2022-11-02	Code
6	Wukong (ViT-L/14)	94.4	No	Wukong: A 100 Million Large-scale Chinese Cross-...	2022-02-14	Code
7	R2D2 (ViT-B)	94.2	No	CCMB: A Large-scale Chinese Cross-modal Benchmark	2022-05-08	Code
8	Wukong (ViT-B/32)	91.4	No	Wukong: A 100 Million Large-scale Chinese Cross-...	2022-02-14	Code
9	CN-CLIP (RN50)	91.1	No	Chinese CLIP: Contrastive Vision-Language Pretra...	2022-11-02	Code

#1CN-CLIP (ViT-B/16)SOTA
97.1
R@5· 2022-11-02
Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese Code
#2CN-CLIP (ViT-H/14)
96.9
R@5· 2022-11-02
Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese Code
#3CN-CLIP (ViT-L/14@336px)
96.7
R@5· 2022-11-02
Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese Code
#4R2D2 (ViT-L/14)SOTA
96.5
R@5· 2022-05-08
CCMB: A Large-scale Chinese Cross-modal Benchmark Code
#5CN-CLIP (ViT-L/14)
96.3
R@5· 2022-11-02
Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese Code
#6Wukong (ViT-L/14)SOTA
94.4
R@5· 2022-02-14
Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark Code
#7R2D2 (ViT-B)
94.2
R@5· 2022-05-08
CCMB: A Large-scale Chinese Cross-modal Benchmark Code
#8Wukong (ViT-B/32)
91.4
R@5· 2022-02-14
Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark Code
#9CN-CLIP (RN50)
91.1
R@5· 2022-11-02
Chinese CLIP: Contrastive Vision-Language Pretraining in Chinese Code