Semi-supervised Human Pose Estimation in Art-historical Images

Matthias Springstein, Stefanie Schneider, Christian Althaus, Ralph Ewerth

2022-07-06Style Transfer 2D Human Pose Estimation Pose Estimation Keypoint Detection Retrieval Semi-Supervised Human Pose Estimation

Paper PDF Code(official)

Abstract

Gesture as language of non-verbal communication has been theoretically established since the 17th century. However, its relevance for the visual arts has been expressed only sporadically. This may be primarily due to the sheer overwhelming amount of data that traditionally had to be processed by hand. With the steady progress of digitization, though, a growing number of historical artifacts have been indexed and made available to the public, creating a need for automatic retrieval of art-historical motifs with similar body constellations or poses. Since the domain of art differs significantly from existing real-world data sets for human pose estimation due to its style variance, this presents new challenges. In this paper, we propose a novel approach to estimate human poses in art-historical images. In contrast to previous work that attempts to bridge the domain gap with pre-trained models or through style transfer, we suggest semi-supervised learning for both object and keypoint detection. Furthermore, we introduce a novel domain-specific art data set that includes both bounding box and keypoint annotations of human figures. Our approach achieves significantly better results than methods that use pre-trained models or style transfer.

Results

Task	Dataset	Metric	Value	Model
Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP	52.58	HRNet-W32
3D	PoPArt	mAP@0.5	63.92	HRNet-W32
3D	PoPArt	mAP@0.75	57.35	HRNet-W32
3D	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	52.58	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	63.92	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	57.35	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)

Abstract

Results

Task	Dataset	Metric	Value	Model
Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP	52.58	HRNet-W32
3D	PoPArt	mAP@0.5	63.92	HRNet-W32
3D	PoPArt	mAP@0.75	57.35	HRNet-W32
3D	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
3D	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
3D	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
3D	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
3D	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
2D Human Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
2D Human Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
2D Human Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	52.58	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP@0.5	63.92	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP@0.75	57.35	HRNet-W32
Multi-Person Pose Estimation	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
Multi-Person Pose Estimation	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
Multi-Person Pose Estimation	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	52.58	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	63.92	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	57.35	HRNet-W32
1 Image, 2*2 Stitchi	PoPArt	mAP	29.71	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	36.37	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	32.72	HRNet-W32 (trained on PeopleArt)
1 Image, 2*2 Stitchi	PoPArt	mAP	25.25	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	31.73	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	28.1	HRNet-W32 (trained on COCO 2017 with 0 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	25.18	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	31.67	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	28.13	HRNet-W32 (trained on COCO 2017 with 100 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP	24.13	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.5	30.52	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)
1 Image, 2*2 Stitchi	PoPArt	mAP@0.75	26.65	HRNet-W32 (trained on COCO 2017 with 50 % style-transferred Material)

Semi-supervised Human Pose Estimation in Art-historical Images

Abstract

Results

Related Papers

Semi-supervised Human Pose Estimation in Art-historical Images

Abstract

Results

Related Papers