MaskCLR

Reported on 32 benchmarks across 8 tasks

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Computer Vision12 results

VideoonNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
VideoonNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
VideoonNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
VideoonNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])
Temporal Action LocalizationonNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
Temporal Action LocalizationonNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
Temporal Action LocalizationonNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
Temporal Action LocalizationonNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])
Action LocalizationonNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
Action LocalizationonNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
Action LocalizationonNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
Action LocalizationonNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])

Action DetectiononNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
Action DetectiononNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
Action DetectiononNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
Action DetectiononNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])
Action RecognitiononNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 96.7 (DSCNet (RGB + Pose))
Action RecognitiononNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 95.6 (DSCNet (RGB + Pose))
Action RecognitiononNTU RGB+D
Accuracy (CS)
93.9
best: 97.4 (DSCNet (RGB + Pose))
Action RecognitiononNTU RGB+D
Accuracy (CV)
97.3
best: 99.6 (PoseC3D (RGB + Pose))

Zero-Shot LearningonNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
Zero-Shot LearningonNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
Zero-Shot LearningonNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
Zero-Shot LearningonNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])

Activity RecognitiononNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 96.7 (DSCNet (RGB + Pose))
Activity RecognitiononNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 95.6 (DSCNet (RGB + Pose))
Activity RecognitiononNTU RGB+D
Accuracy (CS)
93.9
best: 97.4 (DSCNet (RGB + Pose))
Activity RecognitiononNTU RGB+D
Accuracy (CV)
97.3
best: 99.6 (PoseC3D (RGB + Pose))

3D Action RecognitiononNTU RGB+D 120
Accuracy (Cross-Setup)
89.5
best: 92.2 (ProtoGCN)
3D Action RecognitiononNTU RGB+D 120
Accuracy (Cross-Subject)
87.4
best: 90.9 (ProtoGCN)
3D Action RecognitiononNTU RGB+D
Accuracy (CS)
93.9
best: 94.3 (Hulk(Finetune, ViT-L))
3D Action RecognitiononNTU RGB+D
Accuracy (CV)
97.3
best: 98.3 (ST-GCN [PYSKL, 2D Skeleton])