Video on MAD

Metric: R@50,IoU=0.3 (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	R@50,IoU=0.3▼	Extra Data	Paper	Date↕	Code
1	VLG-Net + Guidance Model	39.77	No	Localizing Moments in Long Video Via Multimodal ...	2023-02-26	Code
2	VLG-Net	33.68	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code
3	Zero-Shot CLIP + Guidance Model	32.23	No	Localizing Moments in Long Video Via Multimodal ...	2023-02-26	Code
4	CLIP	28.71	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code
5	Random Chance	1.92	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code

#1VLG-Net + Guidance ModelSOTA
39.77
R@50,IoU=0.3· 2023-02-26
Localizing Moments in Long Video Via Multimodal Guidance Code
#2VLG-NetSOTA
33.68
R@50,IoU=0.3· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code
#3Zero-Shot CLIP + Guidance Model
32.23
R@50,IoU=0.3· 2023-02-26
Localizing Moments in Long Video Via Multimodal Guidance Code
#4CLIP
28.71
R@50,IoU=0.3· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code
#5Random Chance
1.92
R@50,IoU=0.3· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code