AutoGCN -- Towards Generic Human Activity Recognition with Neural Architecture Search

Felix Tempel, Inga Strümke, Espen Alexander F. Ihlen

2024-02-02Skeleton Based Action Recognition Human Activity Recognition Neural Architecture Search Action Recognition Activity Recognition

Paper PDF Code(official)

Abstract

This paper introduces AutoGCN, a generic Neural Architecture Search (NAS) algorithm for Human Activity Recognition (HAR) using Graph Convolution Networks (GCNs). HAR has gained attention due to advances in deep learning, increased data availability, and enhanced computational capabilities. At the same time, GCNs have shown promising results in modeling relationships between body key points in a skeletal graph. While domain experts often craft dataset-specific GCN-based methods, their applicability beyond this specific context is severely limited. AutoGCN seeks to address this limitation by simultaneously searching for the ideal hyperparameters and architecture combination within a versatile search space using a reinforcement controller while balancing optimal exploration and exploitation behavior with a knowledge reservoir during the search process. We conduct extensive experiments on two large-scale datasets focused on skeleton-based action recognition to assess the proposed algorithm's performance. Our experimental results underscore the effectiveness of AutoGCN in constructing optimal GCN architectures for HAR, outperforming conventional NAS and GCN methods, as well as random search. These findings highlight the significance of a diverse search space and an expressive input representation to enhance the network performance and generalizability.

Results

Task	Dataset	Metric	Value	Model
Video	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Video	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Activity Recognition	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Activity Recognition	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Action Localization	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Action Localization	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Action Detection	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Action Detection	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
3D Action Recognition	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
3D Action Recognition	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN
Action Recognition	NTU RGB+D	Accuracy (CS)	88.3	AutoGCN
Action Recognition	NTU RGB+D	Accuracy (CV)	95.5	AutoGCN

AutoGCN -- Towards Generic Human Activity Recognition with Neural Architecture Search

Abstract

Results

Related Papers

AutoGCN -- Towards Generic Human Activity Recognition with Neural Architecture Search

Abstract

Results

Related Papers