Multimodal Virtual Point 3D Detection

Tianwei Yin, Xingyi Zhou, Philipp Krähenbühl

2021-11-12NeurIPS 2021 12Autonomous Vehicles Autonomous Driving 3D Object Detection

Abstract

Lidar-based sensing drives current autonomous vehicles. Despite rapid progress, current Lidar sensors still lag two decades behind traditional color cameras in terms of resolution and cost. For autonomous driving, this means that large objects close to the sensors are easily visible, but far-away or small objects comprise only one measurement or two. This is an issue, especially when these objects turn out to be driving hazards. On the other hand, these same objects are clearly visible in onboard RGB sensors. In this work, we present an approach to seamlessly fuse RGB sensors into Lidar-based 3D recognition. Our approach takes a set of 2D detections to generate dense 3D virtual points to augment an otherwise sparse 3D point cloud. These virtual points naturally integrate into any standard Lidar-based 3D detectors along with regular Lidar measurements. The resulting multi-modal detector is simple and effective. Experimental results on the large-scale nuScenes dataset show that our framework improves a strong CenterPoint baseline by a significant 6.6 mAP, and outperforms competing fusion approaches. Code and more visualizations are available at https://tianweiy.github.io/mvp/

Results

Task	Dataset	Metric	Value	Model
Object Detection	nuScenes	NDS	0.71	MVP
Object Detection	nuScenes	mAAE	0.13	MVP
Object Detection	nuScenes	mAOE	0.32	MVP
Object Detection	nuScenes	mAP	0.66	MVP
Object Detection	nuScenes	mASE	0.24	MVP
Object Detection	nuScenes	mATE	0.26	MVP
Object Detection	nuScenes	mAVE	0.31	MVP
3D	nuScenes	NDS	0.71	MVP
3D	nuScenes	mAAE	0.13	MVP
3D	nuScenes	mAOE	0.32	MVP
3D	nuScenes	mAP	0.66	MVP
3D	nuScenes	mASE	0.24	MVP
3D	nuScenes	mATE	0.26	MVP
3D	nuScenes	mAVE	0.31	MVP
3D Object Detection	nuScenes	NDS	0.71	MVP
3D Object Detection	nuScenes	mAAE	0.13	MVP
3D Object Detection	nuScenes	mAOE	0.32	MVP
3D Object Detection	nuScenes	mAP	0.66	MVP
3D Object Detection	nuScenes	mASE	0.24	MVP
3D Object Detection	nuScenes	mATE	0.26	MVP
3D Object Detection	nuScenes	mAVE	0.31	MVP
2D Classification	nuScenes	NDS	0.71	MVP
2D Classification	nuScenes	mAAE	0.13	MVP
2D Classification	nuScenes	mAOE	0.32	MVP
2D Classification	nuScenes	mAP	0.66	MVP
2D Classification	nuScenes	mASE	0.24	MVP
2D Classification	nuScenes	mATE	0.26	MVP
2D Classification	nuScenes	mAVE	0.31	MVP
2D Object Detection	nuScenes	NDS	0.71	MVP
2D Object Detection	nuScenes	mAAE	0.13	MVP
2D Object Detection	nuScenes	mAOE	0.32	MVP
2D Object Detection	nuScenes	mAP	0.66	MVP
2D Object Detection	nuScenes	mASE	0.24	MVP
2D Object Detection	nuScenes	mATE	0.26	MVP
2D Object Detection	nuScenes	mAVE	0.31	MVP
16k	nuScenes	NDS	0.71	MVP
16k	nuScenes	mAAE	0.13	MVP
16k	nuScenes	mAOE	0.32	MVP
16k	nuScenes	mAP	0.66	MVP
16k	nuScenes	mASE	0.24	MVP
16k	nuScenes	mATE	0.26	MVP
16k	nuScenes	mAVE	0.31	MVP

Multimodal Virtual Point 3D Detection

Abstract

Results

Related Papers

Multimodal Virtual Point 3D Detection

Abstract

Results

Related Papers