Motion Representations for Articulated Animation

Aliaksandr Siarohin, Oliver J. Woodford, Jian Ren, Menglei Chai, Sergey Tulyakov

2021-04-22CVPR 2021 1Video Reconstruction

Abstract

We propose novel motion representations for animating articulated objects consisting of distinct parts. In a completely unsupervised manner, our method identifies object parts, tracks them in a driving video, and infers their motions by considering their principal axes. In contrast to the previous keypoint-based works, our method extracts meaningful and consistent regions, describing locations, shape, and pose. The regions correspond to semantically relevant and distinct object parts, that are more easily detected in frames of the driving video. To force decoupling of foreground from background, we model non-object related global motion with an additional affine transformation. To facilitate animation and prevent the leakage of the shape of the driving object, we disentangle shape and pose of objects in the region space. Our model can animate a variety of objects, surpassing previous methods by a large margin on existing benchmarks. We present a challenging new benchmark with high-resolution videos and show that the improvement is particularly pronounced when articulated objects are considered, reaching 96.6% user preference vs. the state of the art.

Results

Task	Dataset	Metric	Value	Model
3D	Tai-Chi-HD (256)	AED	0.152	Siarohin et al.
3D	Tai-Chi-HD (256)	AKD	5.58	Siarohin et al.
3D	Tai-Chi-HD (256)	L1	0.047	Siarohin et al.
3D	Tai-Chi-HD (256)	MKR	0.027	Siarohin et al.
3D	Tai-Chi-HD (256)	AED	0.172	FOMM
3D	Tai-Chi-HD (256)	AKD	6.53	FOMM
3D	Tai-Chi-HD (256)	L1	0.056	FOMM
3D	Tai-Chi-HD (256)	MKR	0.033	FOMM
3D	VoxCeleb	AED	0.133	Siarohin et al.
3D	VoxCeleb	AKD	1.28	Siarohin et al.
3D	VoxCeleb	L1	0.04	Siarohin et al.
3D	VoxCeleb	AED	0.134	FOMM
3D	VoxCeleb	AKD	1.27	FOMM
3D	VoxCeleb	L1	0.041	FOMM
3D	Tai-Chi-HD (512)	AED	0.172	Siarohin et al.
3D	Tai-Chi-HD (512)	AKD	13.86	Siarohin et al.
3D	Tai-Chi-HD (512)	L1	0.064	Siarohin et al.
3D	Tai-Chi-HD (512)	MKR	0.043	Siarohin et al.
3D	Tai-Chi-HD (512)	AED	0.203	FOMM
3D	Tai-Chi-HD (512)	AKD	17.12	FOMM
3D	Tai-Chi-HD (512)	L1	0.075	FOMM
3D	Tai-Chi-HD (512)	MKR	0.066	FOMM
3D	MGif	L1	0.0206	Siarohin et al.
3D	MGif	L1	0.0223	FOMM
3D	TED-talks	AED	0.114	Siarohin et al.
3D	TED-talks	AKD	3.75	Siarohin et al.
3D	TED-talks	L1	0.026	Siarohin et al.
3D	TED-talks	MKR	0.007	Siarohin et al.
3D	TED-talks	AED	0.163	FOMM
3D	TED-talks	AKD	7.07	FOMM
3D	TED-talks	L1	0.033	FOMM
3D	TED-talks	MKR	0.014	FOMM
Video Reconstruction	Tai-Chi-HD (256)	AED	0.152	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (256)	AKD	5.58	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (256)	L1	0.047	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (256)	MKR	0.027	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (256)	AED	0.172	FOMM
Video Reconstruction	Tai-Chi-HD (256)	AKD	6.53	FOMM
Video Reconstruction	Tai-Chi-HD (256)	L1	0.056	FOMM
Video Reconstruction	Tai-Chi-HD (256)	MKR	0.033	FOMM
Video Reconstruction	VoxCeleb	AED	0.133	Siarohin et al.
Video Reconstruction	VoxCeleb	AKD	1.28	Siarohin et al.
Video Reconstruction	VoxCeleb	L1	0.04	Siarohin et al.
Video Reconstruction	VoxCeleb	AED	0.134	FOMM
Video Reconstruction	VoxCeleb	AKD	1.27	FOMM
Video Reconstruction	VoxCeleb	L1	0.041	FOMM
Video Reconstruction	Tai-Chi-HD (512)	AED	0.172	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (512)	AKD	13.86	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (512)	L1	0.064	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (512)	MKR	0.043	Siarohin et al.
Video Reconstruction	Tai-Chi-HD (512)	AED	0.203	FOMM
Video Reconstruction	Tai-Chi-HD (512)	AKD	17.12	FOMM
Video Reconstruction	Tai-Chi-HD (512)	L1	0.075	FOMM
Video Reconstruction	Tai-Chi-HD (512)	MKR	0.066	FOMM
Video Reconstruction	MGif	L1	0.0206	Siarohin et al.
Video Reconstruction	MGif	L1	0.0223	FOMM
Video Reconstruction	TED-talks	AED	0.114	Siarohin et al.
Video Reconstruction	TED-talks	AKD	3.75	Siarohin et al.
Video Reconstruction	TED-talks	L1	0.026	Siarohin et al.
Video Reconstruction	TED-talks	MKR	0.007	Siarohin et al.
Video Reconstruction	TED-talks	AED	0.163	FOMM
Video Reconstruction	TED-talks	AKD	7.07	FOMM
Video Reconstruction	TED-talks	L1	0.033	FOMM
Video Reconstruction	TED-talks	MKR	0.014	FOMM

Motion Representations for Articulated Animation

Abstract

Results

Related Papers

Motion Representations for Articulated Animation

Abstract

Results

Related Papers