Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot

Fabien Baradel, Matthieu Armando, Salma Galaaoui, Romain Brégier, Philippe Weinzaepfel, Grégory Rogez, Thomas Lucas

2024-02-223D Human Pose Estimation Human Mesh Recovery 3D Human Reconstruction 3D Multi-Person Pose Estimation 3D Multi-Person Mesh Recovery

Paper PDF Code(official)

Abstract

We present Multi-HMR, a strong sigle-shot model for multi-person 3D human mesh recovery from a single RGB image. Predictions encompass the whole body, i.e., including hands and facial expressions, using the SMPL-X parametric model and 3D location in the camera coordinate system. Our model detects people by predicting coarse 2D heatmaps of person locations, using features produced by a standard Vision Transformer (ViT) backbone. It then predicts their whole-body pose, shape and 3D location using a new cross-attention module called the Human Prediction Head (HPH), with one query attending to the entire set of features for each detected person. As direct prediction of fine-grained hands and facial poses in a single shot, i.e., without relying on explicit crops around body parts, is hard to learn from existing data, we introduce CUFFS, the Close-Up Frames of Full-Body Subjects dataset, containing humans close to the camera with diverse hand poses. We show that incorporating it into the training data further enhances predictions, particularly for hands. Multi-HMR also optionally accounts for camera intrinsics, if available, by encoding camera ray directions for each image token. This simple design achieves strong performance on whole-body and body-only benchmarks simultaneously: a ViT-S backbone on $448{\times}448$ images already yields a fast and competitive model, while larger models and higher resolutions obtain state-of-the-art results.

Results

Task	Dataset	Metric	Value	Model
Reconstruction	EHF	MPVPE	44.2	Multi-HMR
Reconstruction	EHF	PA V2V (mm), face	5.5	Multi-HMR
Reconstruction	EHF	PA V2V (mm), whole body	32.7	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-All	23.6	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-Face	1.8	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-Hands	7	Multi-HMR
3D Human Pose Estimation	UBody	PVE-All	56.4	Multi-HMR
3D Human Pose Estimation	UBody	PVE-Face	19.3	Multi-HMR
3D Human Pose Estimation	UBody	PVE-Hands	24.9	Multi-HMR
3D Human Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D Human Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
3D Human Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
Pose Estimation	UBody	PA-PVE-All	23.6	Multi-HMR
Pose Estimation	UBody	PA-PVE-Face	1.8	Multi-HMR
Pose Estimation	UBody	PA-PVE-Hands	7	Multi-HMR
Pose Estimation	UBody	PVE-All	56.4	Multi-HMR
Pose Estimation	UBody	PVE-Face	19.3	Multi-HMR
Pose Estimation	UBody	PVE-Hands	24.9	Multi-HMR
Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
3D	UBody	PA-PVE-All	23.6	Multi-HMR
3D	UBody	PA-PVE-Face	1.8	Multi-HMR
3D	UBody	PA-PVE-Hands	7	Multi-HMR
3D	UBody	PVE-All	56.4	Multi-HMR
3D	UBody	PVE-Face	19.3	Multi-HMR
3D	UBody	PVE-Hands	24.9	Multi-HMR
3D	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D	AGORA	FB-MVE	95.9	Multi-HMR
3D	AGORA	FB-NMVE	102	Multi-HMR
3D Multi-Person Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D Multi-Person Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
3D Multi-Person Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
Human Mesh Recovery	BEDLAM	PVE-All	76.8	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-All	23.6	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-Face	1.8	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-Hands	7	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-All	56.4	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-Face	19.3	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-Hands	24.9	Multi-HMR
1 Image, 2*2 Stitchi	MuPoTS-3D	3DPCK	89.5	Multi-HMR
1 Image, 2*2 Stitchi	AGORA	FB-MVE	95.9	Multi-HMR
1 Image, 2*2 Stitchi	AGORA	FB-NMVE	102	Multi-HMR

Abstract

Results

Task	Dataset	Metric	Value	Model
Reconstruction	EHF	MPVPE	44.2	Multi-HMR
Reconstruction	EHF	PA V2V (mm), face	5.5	Multi-HMR
Reconstruction	EHF	PA V2V (mm), whole body	32.7	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-All	23.6	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-Face	1.8	Multi-HMR
3D Human Pose Estimation	UBody	PA-PVE-Hands	7	Multi-HMR
3D Human Pose Estimation	UBody	PVE-All	56.4	Multi-HMR
3D Human Pose Estimation	UBody	PVE-Face	19.3	Multi-HMR
3D Human Pose Estimation	UBody	PVE-Hands	24.9	Multi-HMR
3D Human Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D Human Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
3D Human Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
Pose Estimation	UBody	PA-PVE-All	23.6	Multi-HMR
Pose Estimation	UBody	PA-PVE-Face	1.8	Multi-HMR
Pose Estimation	UBody	PA-PVE-Hands	7	Multi-HMR
Pose Estimation	UBody	PVE-All	56.4	Multi-HMR
Pose Estimation	UBody	PVE-Face	19.3	Multi-HMR
Pose Estimation	UBody	PVE-Hands	24.9	Multi-HMR
Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
3D	UBody	PA-PVE-All	23.6	Multi-HMR
3D	UBody	PA-PVE-Face	1.8	Multi-HMR
3D	UBody	PA-PVE-Hands	7	Multi-HMR
3D	UBody	PVE-All	56.4	Multi-HMR
3D	UBody	PVE-Face	19.3	Multi-HMR
3D	UBody	PVE-Hands	24.9	Multi-HMR
3D	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D	AGORA	FB-MVE	95.9	Multi-HMR
3D	AGORA	FB-NMVE	102	Multi-HMR
3D Multi-Person Pose Estimation	MuPoTS-3D	3DPCK	89.5	Multi-HMR
3D Multi-Person Pose Estimation	AGORA	FB-MVE	95.9	Multi-HMR
3D Multi-Person Pose Estimation	AGORA	FB-NMVE	102	Multi-HMR
Human Mesh Recovery	BEDLAM	PVE-All	76.8	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-All	23.6	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-Face	1.8	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PA-PVE-Hands	7	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-All	56.4	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-Face	19.3	Multi-HMR
1 Image, 2*2 Stitchi	UBody	PVE-Hands	24.9	Multi-HMR
1 Image, 2*2 Stitchi	MuPoTS-3D	3DPCK	89.5	Multi-HMR
1 Image, 2*2 Stitchi	AGORA	FB-MVE	95.9	Multi-HMR
1 Image, 2*2 Stitchi	AGORA	FB-NMVE	102	Multi-HMR

Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot

Abstract

Results

Related Papers

Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot

Abstract

Results

Related Papers