Referring Expression Segmentation on RefCOCOg-test

Metric: Overall IoU (higher is better)

LeaderboardDataset

Loading chart...

Results

Hide extra data

Sort:

#	Model↕	Overall IoU▼	Extra Data	Paper	Date↕	Code
1	UniLSeg-100	80.54	Yes	Universal Segmentation at Arbitrary Granularity ...	2023-12-04	Code
2	MLCD-Seg-7B	80.5	Yes	Multi-label Cluster Discrimination for Visual Re...	2024-07-24	Code
3	UniLSeg-20	79.47	Yes	Universal Segmentation at Arbitrary Granularity ...	2023-12-04	Code
4	HyperSeg	78.9	Yes	HyperSeg: Towards Universal Visual Segmentation ...	2024-11-26	Code
5	EVF-SAM	78.3	Yes	EVF-SAM: Early Vision-Language Fusion for Text-P...	2024-06-28	Code
6	C3VG	76.39	No	Multi-task Visual Grounding with Coarse-to-Fine ...	2025-01-12	Code
7	DETRIS	75.3	No	Densely Connected Parameter-Efficient Tuning for...	2025-01-15	Code
8	GROUNDHOG	74.6	Yes	GROUNDHOG: Grounding Large Language Models to Ho...	2024-02-26	-
9	MaskRIS (Swin-B, combined DB)	71.09	No	MaskRIS: Semantic Distortion-aware Data Augmenta...	2024-11-28	Code
10	SafaRi-B	71.06	Yes	SafaRi:Adaptive Sequence Transformer for Weakly ...	2024-07-02	-
11	PolyFormer-L	70.19	Yes	PolyFormer: Referring Image Segmentation as Sequ...	2023-02-14	Code
12	PolyFormer-B	69.05	Yes	PolyFormer: Referring Image Segmentation as Sequ...	2023-02-14	Code
13	MaskRIS (Swin-B)	66.5	No	MaskRIS: Semantic Distortion-aware Data Augmenta...	2024-11-28	Code
14	MagNet	66.03	No	Mask Grounding for Referring Image Segmentation	2023-12-19	Code
15	LAVT (Swin-B)	62.09	No	LAVT: Language-Aware Vision Transformer for Refe...	2021-12-04	Code
16	VLT (Darknet53)	56.65	No	Vision-Language Transformer and Query Generation...	2021-08-12	Code

#1UniLSeg-100SOTA
80.54
Overall IoU· Extra Data· 2023-12-04
Universal Segmentation at Arbitrary Granularity with Language Instruction Code
#2MLCD-Seg-7B
80.5
Overall IoU· Extra Data· 2024-07-24
Multi-label Cluster Discrimination for Visual Representation Learning Code
#3UniLSeg-20
79.47
Overall IoU· Extra Data· 2023-12-04
Universal Segmentation at Arbitrary Granularity with Language Instruction Code
#4HyperSeg
78.9
Overall IoU· Extra Data· 2024-11-26
HyperSeg: Towards Universal Visual Segmentation with Large Language Model Code
#5EVF-SAM
78.3
Overall IoU· Extra Data· 2024-06-28
EVF-SAM: Early Vision-Language Fusion for Text-Prompted Segment Anything Model Code
#6C3VG
76.39
Overall IoU· 2025-01-12
Multi-task Visual Grounding with Coarse-to-Fine Consistency Constraints Code
#7DETRIS
75.3
Overall IoU· 2025-01-15
Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation Code
#8GROUNDHOG
74.6
Overall IoU· Extra Data· 2024-02-26
GROUNDHOG: Grounding Large Language Models to Holistic Segmentation
#9MaskRIS (Swin-B, combined DB)
71.09
Overall IoU· 2024-11-28
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation Code
#10SafaRi-B
71.06
Overall IoU· Extra Data· 2024-07-02
SafaRi:Adaptive Sequence Transformer for Weakly Supervised Referring Expression Segmentation
#11PolyFormer-LSOTA
70.19
Overall IoU· Extra Data· 2023-02-14
PolyFormer: Referring Image Segmentation as Sequential Polygon Generation Code
#12PolyFormer-B
69.05
Overall IoU· Extra Data· 2023-02-14
PolyFormer: Referring Image Segmentation as Sequential Polygon Generation Code
#13MaskRIS (Swin-B)
66.5
Overall IoU· 2024-11-28
MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation Code
#14MagNet
66.03
Overall IoU· 2023-12-19
Mask Grounding for Referring Image Segmentation Code
#15LAVT (Swin-B)SOTA
62.09
Overall IoU· 2021-12-04
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Code
#16VLT (Darknet53)SOTA
56.65
Overall IoU· 2021-08-12
Vision-Language Transformer and Query Generation for Referring Segmentation Code