Making the Invisible Visible: Action Recognition Through Walls and Occlusions

Tianhong Li, Lijie Fan, Ming-Min Zhao, Yingcheng Liu, Dina Katabi

2019-09-20ICCV 2019 103D Human Pose Estimation Skeleton Based Action Recognition Action Recognition

Abstract

Understanding people's actions and interactions typically depends on seeing them. Automating the process of action recognition from visual data has been the topic of much research in the computer vision community. But what if it is too dark, or if the person is occluded or behind a wall? In this paper, we introduce a neural network model that can detect human actions through walls and occlusions, and in poor lighting conditions. Our model takes radio frequency (RF) signals as input, generates 3D human skeletons as an intermediate representation, and recognizes actions and interactions of multiple people over time. By translating the input to an intermediate skeleton-based representation, our model can learn from both vision-based and RF-based datasets, and allow the two tasks to help each other. We show that our model achieves comparable accuracy to vision-based action recognition systems in visible scenarios, yet continues to work accurately when people are not visible, hence addressing scenarios that are beyond the limit of today's vision-based action recognition.

Results

Task	Dataset	Metric	Value	Model
Video	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Video	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Video	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Video	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
Temporal Action Localization	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Temporal Action Localization	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Temporal Action Localization	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Temporal Action Localization	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
Zero-Shot Learning	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Zero-Shot Learning	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Zero-Shot Learning	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Zero-Shot Learning	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
Activity Recognition	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Activity Recognition	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Activity Recognition	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Activity Recognition	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
Action Localization	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Action Localization	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Action Localization	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Action Localization	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
Pose Estimation	RF-MMD	mAP (@0.1, Through-wall)	86.5	RF-Action
Pose Estimation	RF-MMD	mAP (@0.1, Visible)	90.1	RF-Action
Action Detection	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Action Detection	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Action Detection	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Action Detection	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
3D Action Recognition	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
3D Action Recognition	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
3D Action Recognition	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
3D Action Recognition	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
3D	RF-MMD	mAP (@0.1, Through-wall)	86.5	RF-Action
3D	RF-MMD	mAP (@0.1, Visible)	90.1	RF-Action
Action Recognition	PKU-MMD	mAP@0.50 (CS)	92.9	RF-Action
Action Recognition	PKU-MMD	mAP@0.50 (CV)	94.4	RF-Action
Action Recognition	NTU RGB+D	Accuracy (CS)	86.8	RF-Action
Action Recognition	NTU RGB+D	Accuracy (CV)	91.6	RF-Action
1 Image, 2*2 Stitchi	RF-MMD	mAP (@0.1, Through-wall)	86.5	RF-Action
1 Image, 2*2 Stitchi	RF-MMD	mAP (@0.1, Visible)	90.1	RF-Action

Making the Invisible Visible: Action Recognition Through Walls and Occlusions

Abstract

Results

Related Papers

Making the Invisible Visible: Action Recognition Through Walls and Occlusions

Abstract

Results

Related Papers