Video on MAD

Metric: R@10,IoU=0.5 (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	R@10,IoU=0.5▼	Extra Data	Paper	Date↕	Code
1	VLG-Net + Guidance Model	13.72	No	Localizing Moments in Long Video Via Multimodal ...	2023-02-26	Code
2	Zero-Shot CLIP + Guidance Model	11.09	No	Localizing Moments in Long Video Via Multimodal ...	2023-02-26	Code
3	VLG-Net	10.18	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code
4	CLIP	8.38	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code
5	Random Chance	0.14	No	MAD: A Scalable Dataset for Language Grounding i...	2021-12-01	Code

#1VLG-Net + Guidance ModelSOTA
13.72
R@10,IoU=0.5· 2023-02-26
Localizing Moments in Long Video Via Multimodal Guidance Code
#2Zero-Shot CLIP + Guidance Model
11.09
R@10,IoU=0.5· 2023-02-26
Localizing Moments in Long Video Via Multimodal Guidance Code
#3VLG-NetSOTA
10.18
R@10,IoU=0.5· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code
#4CLIP
8.38
R@10,IoU=0.5· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code
#5Random Chance
0.14
R@10,IoU=0.5· 2021-12-01
MAD: A Scalable Dataset for Language Grounding in Videos from Movie Audio Descriptions Code