Disentangling Monocular 3D Object Detection

Andrea Simonelli, Samuel Rota Rota Bulò, Lorenzo Porzi, Manuel López-Antequera, Peter Kontschieder

2019-05-29ICCV 2019 103D Object Detection From Monocular Images Monocular 3D Object Detection Disentanglement object-detection 3D Object Detection Object Detection

Paper PDF

Abstract

In this paper we propose an approach for monocular 3D object detection from a single RGB image, which leverages a novel disentangling transformation for 2D and 3D detection losses and a novel, self-supervised confidence score for 3D bounding boxes. Our proposed loss disentanglement has the twofold advantage of simplifying the training dynamics in the presence of losses with complex interactions of parameters, and sidestepping the issue of balancing independent regression terms. Our solution overcomes these issues by isolating the contribution made by groups of parameters to a given loss, without changing its nature. We further apply loss disentanglement to another novel, signed Intersection-over-Union criterion-driven loss for improving 2D detection results. Besides our methodological innovations, we critically review the AP metric used in KITTI3D, which emerged as the most important dataset for comparing 3D detection results. We identify and resolve a flaw in the 11-point interpolated AP metric, affecting all previously published detection results and particularly biases the results of monocular 3D detection. We provide extensive experimental evaluations and ablation studies on the KITTI3D and nuScenes datasets, setting new state-of-the-art results on object category car by large margins.

Results

Task	Dataset	Metric	Value	Model
Object Detection	nuScenes Cars	AOE	0.08	MonoDIS
Object Detection	nuScenes Cars	AP 0.5m	10.7	MonoDIS
Object Detection	nuScenes Cars	AP 1.0m	37.5	MonoDIS
Object Detection	nuScenes Cars	AP 2.0m	69	MonoDIS
Object Detection	nuScenes Cars	AP 4.0m	85.7	MonoDIS
Object Detection	nuScenes Cars	ASE	0.15	MonoDIS
Object Detection	nuScenes Cars	ATE	0.61	MonoDIS
3D	nuScenes Cars	AOE	0.08	MonoDIS
3D	nuScenes Cars	AP 0.5m	10.7	MonoDIS
3D	nuScenes Cars	AP 1.0m	37.5	MonoDIS
3D	nuScenes Cars	AP 2.0m	69	MonoDIS
3D	nuScenes Cars	AP 4.0m	85.7	MonoDIS
3D	nuScenes Cars	ASE	0.15	MonoDIS
3D	nuScenes Cars	ATE	0.61	MonoDIS
2D Classification	nuScenes Cars	AOE	0.08	MonoDIS
2D Classification	nuScenes Cars	AP 0.5m	10.7	MonoDIS
2D Classification	nuScenes Cars	AP 1.0m	37.5	MonoDIS
2D Classification	nuScenes Cars	AP 2.0m	69	MonoDIS
2D Classification	nuScenes Cars	AP 4.0m	85.7	MonoDIS
2D Classification	nuScenes Cars	ASE	0.15	MonoDIS
2D Classification	nuScenes Cars	ATE	0.61	MonoDIS
2D Object Detection	nuScenes Cars	AOE	0.08	MonoDIS
2D Object Detection	nuScenes Cars	AP 0.5m	10.7	MonoDIS
2D Object Detection	nuScenes Cars	AP 1.0m	37.5	MonoDIS
2D Object Detection	nuScenes Cars	AP 2.0m	69	MonoDIS
2D Object Detection	nuScenes Cars	AP 4.0m	85.7	MonoDIS
2D Object Detection	nuScenes Cars	ASE	0.15	MonoDIS
2D Object Detection	nuScenes Cars	ATE	0.61	MonoDIS
16k	nuScenes Cars	AOE	0.08	MonoDIS
16k	nuScenes Cars	AP 0.5m	10.7	MonoDIS
16k	nuScenes Cars	AP 1.0m	37.5	MonoDIS
16k	nuScenes Cars	AP 2.0m	69	MonoDIS
16k	nuScenes Cars	AP 4.0m	85.7	MonoDIS
16k	nuScenes Cars	ASE	0.15	MonoDIS
16k	nuScenes Cars	ATE	0.61	MonoDIS

Disentangling Monocular 3D Object Detection

Abstract

Results

Related Papers

Disentangling Monocular 3D Object Detection

Abstract

Results

Related Papers