Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Sijie Yan, Yuanjun Xiong, Dahua Lin

2018-01-233D Human Pose Estimation Skeleton Based Action Recognition Multimodal Activity Recognition Action Recognition Temporal Action Localization

Paper PDF Code Code Code(official)Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code Code

Abstract

Dynamics of human body skeletons convey significant information for human action recognition. Conventional approaches for modeling skeletons usually rely on hand-crafted parts or traversal rules, thus resulting in limited expressive power and difficulties of generalization. In this work, we propose a novel model of dynamic skeletons called Spatial-Temporal Graph Convolutional Networks (ST-GCN), which moves beyond the limitations of previous methods by automatically learning both the spatial and temporal patterns from data. This formulation not only leads to greater expressive power but also stronger generalization capability. On two large datasets, Kinetics and NTU-RGBD, it achieves substantial improvements over mainstream methods.

Results

Task	Dataset	Metric	Value	Model
Video	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Video	UAV-Human	CSv1(%)	30.25	ST-GCN
Video	UAV-Human	CSv2(%)	56.14	ST-GCN
Video	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Video	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Temporal Action Localization	UAV-Human	CSv1(%)	30.25	ST-GCN
Temporal Action Localization	UAV-Human	CSv2(%)	56.14	ST-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Zero-Shot Learning	UAV-Human	CSv1(%)	30.25	ST-GCN
Zero-Shot Learning	UAV-Human	CSv2(%)	56.14	ST-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Activity Recognition	H2O (2 Hands and Objects)	Actions Top-1	73.86	ST-GCN
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Activity Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
Activity Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
Activity Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Activity Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Activity Recognition	EV-Action	Accuracy	79.6	ST-GCN (Skeleton Kinect)
Activity Recognition	EV-Action	Accuracy	50.7	ST-GCN (Skeleton Vicon)
Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Localization	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Localization	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Localization	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Localization	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Action Detection	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Detection	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Detection	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Detection	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Detection	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
3D Action Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
3D Action Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Action Recognition	H2O (2 Hands and Objects)	Actions Top-1	73.86	ST-GCN
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN

Abstract

Results

Task	Dataset	Metric	Value	Model
Video	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Video	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Video	UAV-Human	CSv1(%)	30.25	ST-GCN
Video	UAV-Human	CSv2(%)	56.14	ST-GCN
Video	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Video	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Video	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Temporal Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Temporal Action Localization	UAV-Human	CSv1(%)	30.25	ST-GCN
Temporal Action Localization	UAV-Human	CSv2(%)	56.14	ST-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Zero-Shot Learning	UAV-Human	CSv1(%)	30.25	ST-GCN
Zero-Shot Learning	UAV-Human	CSv2(%)	56.14	ST-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Activity Recognition	H2O (2 Hands and Objects)	Actions Top-1	73.86	ST-GCN
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Activity Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Activity Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
Activity Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
Activity Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Activity Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Activity Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Activity Recognition	EV-Action	Accuracy	79.6	ST-GCN (Skeleton Kinect)
Activity Recognition	EV-Action	Accuracy	50.7	ST-GCN (Skeleton Vicon)
Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Localization	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Localization	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Localization	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Localization	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Localization	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Localization	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Action Detection	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Detection	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Detection	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Detection	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Detection	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Detection	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Detection	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
3D Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
3D Action Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
3D Action Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
3D Action Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN
Action Recognition	H2O (2 Hands and Objects)	Actions Top-1	73.86	ST-GCN
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	88.4	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	86.2	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Setup)	89	ST-GCN [PYSKL, 2D Skeleton]
Action Recognition	NTU RGB+D 120	Accuracy (Cross-Subject)	84.7	ST-GCN [PYSKL, 2D Skeleton]
Action Recognition	UAV-Human	CSv1(%)	30.25	ST-GCN
Action Recognition	UAV-Human	CSv2(%)	56.14	ST-GCN
Action Recognition	NTU RGB+D	Accuracy (CS)	90.7	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	96.5	ST-GCN [PYSKL, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	90.1	ST-GCN [Vanilla, 2D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	95.1	ST-GCN [Vanilla, 2D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	86.6	ST-GCN [Vanilla, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	ST-GCN [Vanilla, 3D Skeleton]
Action Recognition	NTU RGB+D	Accuracy (CS)	81.5	ST-GCN
Action Recognition	NTU RGB+D	Accuracy (CV)	88.3	ST-GCN

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Abstract

Results

Related Papers

Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

Abstract

Results

Related Papers