UniHCP: A Unified Model for Human-Centric Perceptions

Yuanzheng Ci, Yizhou Wang, Meilin Chen, Shixiang Tang, Lei Bai, Feng Zhu, Rui Zhao, Fengwei Yu, Donglian Qi, Wanli Ouyang

2023-03-06CVPR 2023 1Pedestrian Attribute Recognition Attribute Human Part Segmentation Human Parsing Semantic Segmentation Pose Estimation Person Re-Identification Pedestrian Detection 2D Pose Estimation Object Detection

Paper PDF Code(official)

Abstract

Human-centric perceptions (e.g., pose estimation, human parsing, pedestrian detection, person re-identification, etc.) play a key role in industrial applications of visual models. While specific human-centric tasks have their own relevant semantic aspect to focus on, they also share the same underlying semantic structure of the human body. However, few works have attempted to exploit such homogeneity and design a general-propose model for human-centric tasks. In this work, we revisit a broad range of human-centric tasks and unify them in a minimalist manner. We propose UniHCP, a Unified Model for Human-Centric Perceptions, which unifies a wide range of human-centric tasks in a simplified end-to-end manner with the plain vision transformer architecture. With large-scale joint training on 33 human-centric datasets, UniHCP can outperform strong baselines on several in-domain and downstream tasks by direct evaluation. When adapted to a specific task, UniHCP achieves new SOTAs on a wide range of human-centric tasks, e.g., 69.8 mIoU on CIHP for human parsing, 86.18 mA on PA-100K for attribute prediction, 90.3 mAP on Market1501 for ReID, and 85.8 JI on CrowdHuman for pedestrian detection, performing better than specialized models tailored for each task.

Results

Task	Dataset	Metric	Value	Model
Autonomous Vehicles	Caltech	Heavy MR^-2	27.2	UniHCP (FT)
Autonomous Vehicles	PA-100K	Accuracy	86.18	UniHCP (finetune)
Autonomous Vehicles	RAPv2	Accuracy	82.34	UniHCP (finetune)
Person Re-Identification	MSMT17	mAP	67.3	UniHCP (finetune)
Person Re-Identification	Market-1501	mAP	90.3	UniHCP (finetune)
Person Re-Identification	SenseReID	Top-1	46	UniHCP (DE)
Person Re-Identification	CUHK03	MAP	83.1	UniHCP (finetune)
Pose Estimation	MS-COCO	AP	76.5	UniHCP (finetune)
Pose Estimation	OCHuman	Test AP	87.4	UniHCP (direct eval)
Pose Estimation	AIC	AP	33.6	UniHCP (finetune)
Pose Estimation	MPII Human Pose	PCKh-0.5	93.2	UniHCP (FT)
2D Pose Estimation	Human3.6M	EPE	6.6	UniHCP (finetune)
Pedestrian Attribute Recognition	PA-100K	Accuracy	86.18	UniHCP (finetune)
Pedestrian Attribute Recognition	RAPv2	Accuracy	82.34	UniHCP (finetune)
Human Part Segmentation	ATR	pACC	97.74	UniHCP (FT)
Human Part Segmentation	Human3.6M	mIoU	65.95	UniHCP (finetune)
Human Part Segmentation	CIHP	Mean IoU	69.8	UniHCP (finetune)
Object Detection	CrowdHuman (full body)	AP	92.5	UniHCP (finetune)
Object Detection	CrowdHuman (full body)	mMR	41.6	UniHCP (finetune)
3D	CrowdHuman (full body)	AP	92.5	UniHCP (finetune)
3D	CrowdHuman (full body)	mMR	41.6	UniHCP (finetune)
3D	MS-COCO	AP	76.5	UniHCP (finetune)
3D	OCHuman	Test AP	87.4	UniHCP (direct eval)
3D	AIC	AP	33.6	UniHCP (finetune)
3D	MPII Human Pose	PCKh-0.5	93.2	UniHCP (FT)
2D Semantic Segmentation	ATR	pACC	97.74	UniHCP (FT)
2D Semantic Segmentation	Human3.6M	mIoU	65.95	UniHCP (finetune)
2D Semantic Segmentation	CIHP	Mean IoU	69.8	UniHCP (finetune)
2D Classification	CrowdHuman (full body)	AP	92.5	UniHCP (finetune)
2D Classification	CrowdHuman (full body)	mMR	41.6	UniHCP (finetune)
2D Classification	Human3.6M	EPE	6.6	UniHCP (finetune)
Pedestrian Detection	Caltech	Heavy MR^-2	27.2	UniHCP (FT)
2D Object Detection	CrowdHuman (full body)	AP	92.5	UniHCP (finetune)
2D Object Detection	CrowdHuman (full body)	mMR	41.6	UniHCP (finetune)
1 Image, 2*2 Stitchi	MS-COCO	AP	76.5	UniHCP (finetune)
1 Image, 2*2 Stitchi	OCHuman	Test AP	87.4	UniHCP (direct eval)
1 Image, 2*2 Stitchi	AIC	AP	33.6	UniHCP (finetune)
1 Image, 2*2 Stitchi	MPII Human Pose	PCKh-0.5	93.2	UniHCP (FT)
16k	CrowdHuman (full body)	AP	92.5	UniHCP (finetune)
16k	CrowdHuman (full body)	mMR	41.6	UniHCP (finetune)

UniHCP: A Unified Model for Human-Centric Perceptions

Abstract

Results

Related Papers

UniHCP: A Unified Model for Human-Centric Perceptions

Abstract

Results

Related Papers