10-shot image generation on ADE20K

Metric: GFLOPs (512 x 512) (higher is better)

LeaderboardDataset

Loading chart...

Results

#	Model↕	GFLOPs (512 x 512)▼	Extra Data	Paper	Date↕	Code
1	ConvNeXt-XL++	3335	No	A ConvNet for the 2020s	2022-01-10	Code
2	ConvNeXt-L++	2458	No	A ConvNet for the 2020s	2022-01-10	Code
3	ConvNeXt-B++	1828	No	A ConvNet for the 2020s	2022-01-10	Code
4	GC ViT-B	1348	No	Global Context Vision Transformers	2022-06-20	Code
5	MogaNet-L (UperNet)	1176	No	MogaNet: Multi-order Gated Aggregation Network	2022-11-07	Code
6	ConvNeXt-B	1170	No	A ConvNet for the 2020s	2022-01-10	Code
7	GC ViT-S	1163	No	Global Context Vision Transformers	2022-06-20	Code
8	NAT-Base	1137	No	Neighborhood Attention Transformer	2022-04-14	Code
9	MogaNet-B (UperNet)	1050	No	MogaNet: Multi-order Gated Aggregation Network	2022-11-07	Code
10	ConvNeXt-S	1027	No	A ConvNet for the 2020s	2022-01-10	Code
11	NAT-Small	1010	No	Neighborhood Attention Transformer	2022-04-14	Code
12	GC ViT-T	947	No	Global Context Vision Transformers	2022-06-20	Code
13	MogaNet-S (UperNet)	946	No	MogaNet: Multi-order Gated Aggregation Network	2022-11-07	Code
14	ConvNeXt-T	939	No	A ConvNet for the 2020s	2022-01-10	Code
15	NAT-Tiny	934	No	Neighborhood Attention Transformer	2022-04-14	Code
16	NAT-Mini	900	No	Neighborhood Attention Transformer	2022-04-14	Code
17	EoMT (DINOv2-L, single-scale, 512x512)	721	No	Your ViT is Secretly an Image Segmentation Model	2025-03-24	Code
18	SegViT-v2 (BEiT-v2-Large)	637.9	No	SegViTv2: Exploring Efficient and Continual Sema...	2023-06-09	Code
19	MogaNet-S (Semantic FPN)	189	No	MogaNet: Multi-order Gated Aggregation Network	2022-11-07	Code
20	Light-Ham (VAN-Huge)	71.8	No	Is Attention Better Than Matrix Decomposition?	2021-09-09	Code
21	HRViT-b3 (SegFormer, SS)	67.9	No	Multi-Scale High-Resolution Vision Transformer f...	2021-11-01	Code
22	Light-Ham (VAN-Large)	55	No	Is Attention Better Than Matrix Decomposition?	2021-09-09	Code
23	Light-Ham (VAN-Base)	34.4	No	Is Attention Better Than Matrix Decomposition?	2021-09-09	Code
24	HRViT-b2 (SegFormer, SS)	28	No	Multi-Scale High-Resolution Vision Transformer f...	2021-11-01	Code
25	Light-Ham (VAN-Small, D=256)	15.8	No	Is Attention Better Than Matrix Decomposition?	2021-09-09	Code
26	HRViT-b1 (SegFormer, SS)	14.6	No	Multi-Scale High-Resolution Vision Transformer f...	2021-11-01	Code