Video on Kinetics-600 12 frames, 64x64

Metric: FVD (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	FVD▼	Extra Data	Paper	Date↕	Code
1	LVT	224.73	No	Latent Video Transformer	2020-06-18	Code
2	OmniTokenizer-AR	32.9	No	OmniTokenizer: A Joint Image-Video Tokenizer for...	2024-06-13	Code
3	DVD-GAN	31.1	No	Adversarial Video Generation on Complex Datasets	2019-07-15	Code
4	RaMViD	16.46	No	Diffusion Models for Video Prediction and Infill...	2022-06-15	Code
5	RIN (400 steps)	11.5	No	Scalable Adaptive Computation for Iterative Gene...	2022-12-22	Code
6	RIN (1000 steps)	10.8	No	Scalable Adaptive Computation for Iterative Gene...	2022-12-22	Code
7	MAGVIT	9.9	No	MAGVIT: Masked Generative Video Transformer	2022-12-10	Code
8	LARP	5.1	No	LARP: Tokenizing Videos with a Learned Autoregre...	2024-10-28	Code
9	W.A.L.T.-L	3.3	No	Photorealistic Video Generation with Diffusion M...	2023-12-11	-
10	SiD2	2.3	No	Simpler Diffusion (SiD2): 1.5 FID on ImageNet512...	2024-10-25	-

#1LVTSOTA
224.73
FVD· 2020-06-18
Latent Video Transformer Code
#2OmniTokenizer-AR
32.9
FVD· 2024-06-13
OmniTokenizer: A Joint Image-Video Tokenizer for Visual Generation Code
#3DVD-GANSOTA
31.1
FVD· 2019-07-15
Adversarial Video Generation on Complex Datasets Code
#4RaMViD
16.46
FVD· 2022-06-15
Diffusion Models for Video Prediction and Infilling Code
#5RIN (400 steps)
11.5
FVD· 2022-12-22
Scalable Adaptive Computation for Iterative Generation Code
#6RIN (1000 steps)
10.8
FVD· 2022-12-22
Scalable Adaptive Computation for Iterative Generation Code
#7MAGVIT
9.9
FVD· 2022-12-10
MAGVIT: Masked Generative Video Transformer Code
#8LARP
5.1
FVD· 2024-10-28
LARP: Tokenizing Videos with a Learned Autoregressive Generative Prior Code
#9W.A.L.T.-L
3.3
FVD· 2023-12-11
Photorealistic Video Generation with Diffusion Models
#10SiD2
2.3
FVD· 2024-10-25
Simpler Diffusion (SiD2): 1.5 FID on ImageNet512 with pixel-space diffusion