Image Reconstruction on ImageNet

Metric: FID (lower is better)

LeaderboardDataset

Loading chart...

Results

Sort:

#	Model↕	FID▲	Extra Data	Paper	Date↕	Code
1	MGVQ (16x16x8)	0.49	No	MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tok...	2025-07-10	Code
2	MGVQ (16x16x4)	0.64	No	MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tok...	2025-07-10	Code
3	GigaTok-XL-XXL	0.79	No	GigaTok: Scaling Visual Tokenizers to 3 Billion ...	2025-04-11	Code
4	OptVQ (16x16x8)	0.91	No	Preventing Local Pitfalls in Vector Quantization...	2024-12-19	Code
5	OptVQ (16x16x4)	1	No	Preventing Local Pitfalls in Vector Quantization...	2024-12-19	Code
6	IBQ (16x16)	1	No	Taming Scalable Visual Tokenizer for Autoregress...	2024-12-03	Code
7	Mo-VQGAN (16x16x4)	1.12	No	MoVQ: Modulating Quantized Vectors for High-Fide...	2022-09-19	Code
8	Open-Magvit2 (16x16)	1.17	No	Open-MAGVIT2: An Open-Source Project Toward Demo...	2024-09-06	Code
9	ViT-VQGAN (16x16)	1.28	No	Vector-quantized Image Modeling with Improved VQ...	2021-10-09	Code
10	MaskBit (16x16)	1.66	No	MaskBit: Embedding-free Image Generation via Bit...	2024-09-24	Code
11	TiTok-S-128	1.71	No	An Image is Worth 32 Tokens for Reconstruction a...	2024-06-11	Code
12	RQ-VAE (8x8x16)	1.83	No	Autoregressive Image Generation using Residual Q...	2022-03-03	Code
13	MaskGIT-VQGAN (16x16)	2.28	No	MaskGIT: Masked Generative Image Transformer	2022-02-08	Code
14	VQGAN-LC (16x16)	2.62	No	Scaling the Codebook Size of VQGAN to 100,000 wi...	2024-06-17	Code
15	Taming-VQGAN (16x16)	3.64	No	Taming Transformers for High-Resolution Image Sy...	2020-12-17	Code

#1MGVQ (16x16x8)SOTA
0.49
FID· 2025-07-10
MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tokenizer with Multi-group Quantization Code
#2MGVQ (16x16x4)SOTA
0.64
FID· 2025-07-10
MGVQ: Could VQ-VAE Beat VAE? A Generalizable Tokenizer with Multi-group Quantization Code
#3GigaTok-XL-XXLSOTA
0.79
FID· 2025-04-11
GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation Code
#4OptVQ (16x16x8)SOTA
0.91
FID· 2024-12-19
Preventing Local Pitfalls in Vector Quantization via Optimal Transport Code
#5OptVQ (16x16x4)
1
FID· 2024-12-19
Preventing Local Pitfalls in Vector Quantization via Optimal Transport Code
#6IBQ (16x16)SOTA
1
FID· 2024-12-03
Taming Scalable Visual Tokenizer for Autoregressive Image Generation Code
#7Mo-VQGAN (16x16x4)SOTA
1.12
FID· 2022-09-19
MoVQ: Modulating Quantized Vectors for High-Fidelity Image Generation Code
#8Open-Magvit2 (16x16)
1.17
FID· 2024-09-06
Open-MAGVIT2: An Open-Source Project Toward Democratizing Auto-regressive Visual Generation Code
#9ViT-VQGAN (16x16)SOTA
1.28
FID· 2021-10-09
Vector-quantized Image Modeling with Improved VQGAN Code
#10MaskBit (16x16)
1.66
FID· 2024-09-24
MaskBit: Embedding-free Image Generation via Bit Tokens Code
#11TiTok-S-128
1.71
FID· 2024-06-11
An Image is Worth 32 Tokens for Reconstruction and Generation Code
#12RQ-VAE (8x8x16)
1.83
FID· 2022-03-03
Autoregressive Image Generation using Residual Quantization Code
#13MaskGIT-VQGAN (16x16)
2.28
FID· 2022-02-08
MaskGIT: Masked Generative Image Transformer Code
#14VQGAN-LC (16x16)
2.62
FID· 2024-06-17
Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%Code
#15Taming-VQGAN (16x16)SOTA
3.64
FID· 2020-12-17
Taming Transformers for High-Resolution Image Synthesis Code