Part-based Graph Convolutional Network for Action Recognition

Kalpit Thakkar, P. J. Narayanan

2018-09-13Skeleton Based Action Recognition Action Recognition Temporal Action Localization

Abstract

Human actions comprise of joint motion of articulated body parts or `gestures'. Human skeleton is intuitively represented as a sparse graph with joints as nodes and natural connections between them as edges. Graph convolutional networks have been used to recognize actions from skeletal videos. We introduce a part-based graph convolutional network (PB-GCN) for this task, inspired by Deformable Part-based Models (DPMs). We divide the skeleton graph into four subgraphs with joints shared across them and learn a recognition model using a part-based graph convolutional network. We show that such a model improves performance of recognition, compared to a model using entire skeleton graph. Instead of using 3D joint coordinates as node features, we show that using relative coordinates and temporal displacements boosts performance. Our model achieves state-of-the-art performance on two challenging benchmark datasets NTURGB+D and HDM05, for skeletal action recognition.

Results

Task	Dataset	Metric	Value	Model
Video	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Video	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Activity Recognition	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN (Skeleton only)
Activity Recognition	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN (Skeleton only)
Activity Recognition	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Activity Recognition	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Action Localization	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Action Localization	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Action Detection	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Action Detection	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
3D Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN
Action Recognition	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN (Skeleton only)
Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN (Skeleton only)
Action Recognition	NTU RGB+D	Accuracy (CS)	87.5	PB-GCN
Action Recognition	NTU RGB+D	Accuracy (CV)	93.2	PB-GCN

Part-based Graph Convolutional Network for Action Recognition

Abstract

Results

Related Papers

Part-based Graph Convolutional Network for Action Recognition

Abstract

Results

Related Papers