Cascaded Pyramid Network for Multi-Person Pose Estimation

Yilun Chen, Zhicheng Wang, Yuxiang Peng, Zhiqiang Zhang, Gang Yu, Jian Sun

2017-11-20CVPR 2018 6Pose Estimation Multi-Person Pose Estimation Keypoint Detection

Paper PDF Code(official)Code Code Code Code

Abstract

The topic of multi-person pose estimation has been largely improved recently, especially with the development of convolutional neural network. However, there still exist a lot of challenging cases, such as occluded keypoints, invisible keypoints and complex background, which cannot be well addressed. In this paper, we present a novel network structure called Cascaded Pyramid Network (CPN) which targets to relieve the problem from these "hard" keypoints. More specifically, our algorithm includes two stages: GlobalNet and RefineNet. GlobalNet is a feature pyramid network which can successfully localize the "simple" keypoints like eyes and hands but may fail to precisely recognize the occluded or invisible keypoints. Our RefineNet tries explicitly handling the "hard" keypoints by integrating all levels of feature representations from the GlobalNet together with an online hard keypoint mining loss. In general, to address the multi-person pose estimation problem, a top-down pipeline is adopted to first generate a set of human bounding boxes based on a detector, followed by our CPN for keypoint localization in each human bounding box. Based on the proposed algorithm, we achieve state-of-art results on the COCO keypoint benchmark, with average precision at 73.0 on the COCO test-dev dataset and 72.1 on the COCO test-challenge dataset, which is a 19% relative improvement compared with 60.5 from the COCO 2016 keypoint challenge.Code (https://github.com/chenyilun95/tf-cpn.git) and the detection results are publicly available for further research.

Results

Task	Dataset	Metric	Value	Model
Pose Estimation	COCO test-dev	AP	73	CPN+ [6, 9]
Pose Estimation	COCO test-dev	AP50	91.7	CPN+ [6, 9]
Pose Estimation	COCO test-dev	AP75	80.9	CPN+ [6, 9]
Pose Estimation	COCO test-dev	APL	78.1	CPN+ [6, 9]
Pose Estimation	COCO test-dev	AR	79	CPN+ [6, 9]
Pose Estimation	COCO test-dev	AP	72.1	CPN
Pose Estimation	COCO test-dev	AP50	91.4	CPN
Pose Estimation	COCO test-dev	AP75	80	CPN
Pose Estimation	COCO test-dev	APL	77.2	CPN
Pose Estimation	COCO test-dev	AR	78.5	CPN
Pose Estimation	COCO test-dev	AP50	91.7	CPN+
Pose Estimation	COCO test-dev	AP75	80.9	CPN+
Pose Estimation	COCO test-dev	APL	78.1	CPN+
Pose Estimation	COCO test-dev	APM	69.5	CPN+
Pose Estimation	COCO test-dev	AR	79	CPN+
Pose Estimation	COCO test-dev	AR50	95.1	CPN+
Pose Estimation	COCO test-dev	AR75	85.9	CPN+
Pose Estimation	COCO test-dev	ARL	84.6	CPN+
Pose Estimation	COCO test-dev	ARM	74.8	CPN+
Pose Estimation	COCO test-dev	AP50	91.4	CPN
Pose Estimation	COCO test-dev	AP75	80	CPN
Pose Estimation	COCO test-dev	APL	77.2	CPN
Pose Estimation	COCO test-dev	APM	68.7	CPN
Pose Estimation	COCO test-dev	AR	78.5	CPN
Pose Estimation	COCO test-dev	AR50	95.1	CPN
Pose Estimation	COCO test-dev	AR75	85.3	CPN
Pose Estimation	COCO test-dev	ARL	84.3	CPN
Pose Estimation	COCO test-dev	ARM	74.2	CPN
Pose Estimation	COCO (Common Objects in Context)	Test AP	73	CPN+
Pose Estimation	COCO test-challenge	AP	72.1	CPN+
Pose Estimation	COCO test-challenge	AP50	90.5	CPN+
Pose Estimation	COCO test-challenge	AP75	78.9	CPN+
Pose Estimation	COCO test-challenge	APL	84.7	CPN+
Pose Estimation	COCO test-challenge	AR	78.7	CPN+
Pose Estimation	COCO test-challenge	AR50	94.7	CPN+
Pose Estimation	COCO test-challenge	AR75	84.8	CPN+
Pose Estimation	COCO test-challenge	ARL	78.1	CPN+
Pose Estimation	COCO test-challenge	ARM	74.3	CPN+
Pose Estimation	COCO (Common Objects in Context)	AP	0.73	CPN+
3D	COCO test-dev	AP	73	CPN+ [6, 9]
3D	COCO test-dev	AP50	91.7	CPN+ [6, 9]
3D	COCO test-dev	AP75	80.9	CPN+ [6, 9]
3D	COCO test-dev	APL	78.1	CPN+ [6, 9]
3D	COCO test-dev	AR	79	CPN+ [6, 9]
3D	COCO test-dev	AP	72.1	CPN
3D	COCO test-dev	AP50	91.4	CPN
3D	COCO test-dev	AP75	80	CPN
3D	COCO test-dev	APL	77.2	CPN
3D	COCO test-dev	AR	78.5	CPN
3D	COCO test-dev	AP50	91.7	CPN+
3D	COCO test-dev	AP75	80.9	CPN+
3D	COCO test-dev	APL	78.1	CPN+
3D	COCO test-dev	APM	69.5	CPN+
3D	COCO test-dev	AR	79	CPN+
3D	COCO test-dev	AR50	95.1	CPN+
3D	COCO test-dev	AR75	85.9	CPN+
3D	COCO test-dev	ARL	84.6	CPN+
3D	COCO test-dev	ARM	74.8	CPN+
3D	COCO test-dev	AP50	91.4	CPN
3D	COCO test-dev	AP75	80	CPN
3D	COCO test-dev	APL	77.2	CPN
3D	COCO test-dev	APM	68.7	CPN
3D	COCO test-dev	AR	78.5	CPN
3D	COCO test-dev	AR50	95.1	CPN
3D	COCO test-dev	AR75	85.3	CPN
3D	COCO test-dev	ARL	84.3	CPN
3D	COCO test-dev	ARM	74.2	CPN
3D	COCO (Common Objects in Context)	Test AP	73	CPN+
3D	COCO test-challenge	AP	72.1	CPN+
3D	COCO test-challenge	AP50	90.5	CPN+
3D	COCO test-challenge	AP75	78.9	CPN+
3D	COCO test-challenge	APL	84.7	CPN+
3D	COCO test-challenge	AR	78.7	CPN+
3D	COCO test-challenge	AR50	94.7	CPN+
3D	COCO test-challenge	AR75	84.8	CPN+
3D	COCO test-challenge	ARL	78.1	CPN+
3D	COCO test-challenge	ARM	74.3	CPN+
3D	COCO (Common Objects in Context)	AP	0.73	CPN+
Multi-Person Pose Estimation	COCO (Common Objects in Context)	AP	0.73	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AP	73	CPN+ [6, 9]
1 Image, 2*2 Stitchi	COCO test-dev	AP50	91.7	CPN+ [6, 9]
1 Image, 2*2 Stitchi	COCO test-dev	AP75	80.9	CPN+ [6, 9]
1 Image, 2*2 Stitchi	COCO test-dev	APL	78.1	CPN+ [6, 9]
1 Image, 2*2 Stitchi	COCO test-dev	AR	79	CPN+ [6, 9]
1 Image, 2*2 Stitchi	COCO test-dev	AP	72.1	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AP50	91.4	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AP75	80	CPN
1 Image, 2*2 Stitchi	COCO test-dev	APL	77.2	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AR	78.5	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AP50	91.7	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AP75	80.9	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	APL	78.1	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	APM	69.5	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AR	79	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AR50	95.1	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AR75	85.9	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	ARL	84.6	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	ARM	74.8	CPN+
1 Image, 2*2 Stitchi	COCO test-dev	AP50	91.4	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AP75	80	CPN
1 Image, 2*2 Stitchi	COCO test-dev	APL	77.2	CPN
1 Image, 2*2 Stitchi	COCO test-dev	APM	68.7	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AR	78.5	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AR50	95.1	CPN
1 Image, 2*2 Stitchi	COCO test-dev	AR75	85.3	CPN
1 Image, 2*2 Stitchi	COCO test-dev	ARL	84.3	CPN
1 Image, 2*2 Stitchi	COCO test-dev	ARM	74.2	CPN
1 Image, 2*2 Stitchi	COCO (Common Objects in Context)	Test AP	73	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AP	72.1	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AP50	90.5	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AP75	78.9	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	APL	84.7	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AR	78.7	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AR50	94.7	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	AR75	84.8	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	ARL	78.1	CPN+
1 Image, 2*2 Stitchi	COCO test-challenge	ARM	74.3	CPN+
1 Image, 2*2 Stitchi	COCO (Common Objects in Context)	AP	0.73	CPN+

Cascaded Pyramid Network for Multi-Person Pose Estimation

Abstract

Results

Related Papers

Cascaded Pyramid Network for Multi-Person Pose Estimation

Abstract

Results

Related Papers