Generative Adversarial Graph Convolutional Networks for Human Action Synthesis

Bruno Degardin, João Neves, Vasco Lopes, João Brito, Ehsan Yaghoubi, Hugo Proença

2021-10-21Action Generation Disentanglement Human action generation Motion Synthesis Video Generation

Abstract

Synthesising the spatial and temporal dynamics of the human body skeleton remains a challenging task, not only in terms of the quality of the generated shapes, but also of their diversity, particularly to synthesise realistic body movements of a specific action (action conditioning). In this paper, we propose Kinetic-GAN, a novel architecture that leverages the benefits of Generative Adversarial Networks and Graph Convolutional Networks to synthesise the kinetics of the human body. The proposed adversarial architecture can condition up to 120 different actions over local and global body movements while improving sample quality and diversity through latent space disentanglement and stochastic variations. Our experiments were carried out in three well-known datasets, where Kinetic-GAN notably surpasses the state-of-the-art methods in terms of distribution quality metrics while having the ability to synthesise more than one order of magnitude regarding the number of different actions. Our code and models are publicly available at https://github.com/DegardinBruno/Kinetic-GAN.

Results

Task	Dataset	Metric	Value	Model
Activity Recognition	NTU RGB+D	FID (CS)	3.618	Kinetic-GAN
Activity Recognition	NTU RGB+D	FID (CV)	4.235	Kinetic-GAN
Activity Recognition	NTU RGB+D 120	FID (CS)	5.967	Kinetic-GAN
Activity Recognition	NTU RGB+D 120	FID (CV)	6.751	Kinetic-GAN
Activity Recognition	NTU RGB+D 2D	MMDa (CS)	0.256	Kinetic-GAN
Activity Recognition	NTU RGB+D 2D	MMDa (CV)	0.295	Kinetic-GAN
Activity Recognition	NTU RGB+D 2D	MMDs (CS)	0.273	Kinetic-GAN
Activity Recognition	NTU RGB+D 2D	MMDs (CV)	0.31	Kinetic-GAN
Activity Recognition	Human3.6M	MMDa	0.071	Kinetic-GAN
Activity Recognition	Human3.6M	MMDs	0.082	Kinetic-GAN
Human action generation	NTU RGB+D	FID (CS)	3.618	Kinetic-GAN
Human action generation	NTU RGB+D	FID (CV)	4.235	Kinetic-GAN
Human action generation	NTU RGB+D 120	FID (CS)	5.967	Kinetic-GAN
Human action generation	NTU RGB+D 120	FID (CV)	6.751	Kinetic-GAN
Human action generation	NTU RGB+D 2D	MMDa (CS)	0.256	Kinetic-GAN
Human action generation	NTU RGB+D 2D	MMDa (CV)	0.295	Kinetic-GAN
Human action generation	NTU RGB+D 2D	MMDs (CS)	0.273	Kinetic-GAN
Human action generation	NTU RGB+D 2D	MMDs (CV)	0.31	Kinetic-GAN
Human action generation	Human3.6M	MMDa	0.071	Kinetic-GAN
Human action generation	Human3.6M	MMDs	0.082	Kinetic-GAN

Generative Adversarial Graph Convolutional Networks for Human Action Synthesis

Abstract

Results

Related Papers

Generative Adversarial Graph Convolutional Networks for Human Action Synthesis

Abstract

Results

Related Papers