PointPillars: Fast Encoders for Object Detection from Point Clouds

Alex H. Lang, Sourabh Vora, Holger Caesar, Lubing Zhou, Jiong Yang, Oscar Beijbom

2018-12-14CVPR 2019 6Birds Eye View Object Detection Autonomous Driving object-detection Robust 3D Object Detection 3D Object Detection Object Detection

Paper PDF Code Code Code Code Code Code Code Code Code Code Code Code(official)Code Code Code Code Code Code

Abstract

Object detection in point clouds is an important aspect of many robotics applications such as autonomous driving. In this paper we consider the problem of encoding a point cloud into a format appropriate for a downstream detection pipeline. Recent literature suggests two types of encoders; fixed encoders tend to be fast but sacrifice accuracy, while encoders that are learned from data are more accurate, but slower. In this work we propose PointPillars, a novel encoder which utilizes PointNets to learn a representation of point clouds organized in vertical columns (pillars). While the encoded features can be used with any standard 2D convolutional detection architecture, we further propose a lean downstream network. Extensive experimentation shows that PointPillars outperforms previous encoders with respect to both speed and accuracy by a large margin. Despite only using lidar, our full detection pipeline significantly outperforms the state of the art, even among fusion methods, with respect to both the 3D and bird's eye view KITTI benchmarks. This detection performance is achieved while running at 62 Hz: a 2 - 4 fold runtime improvement. A faster version of our method matches the state of the art at 105 Hz. These benchmarks suggest that PointPillars is an appropriate encoding for object detection in point clouds.

Results

Task	Dataset	Metric	Value	Model
Object Detection	nuScenes LiDAR only	NDS	45.3	PointPillar
Object Detection	nuScenes LiDAR only	mAP	30.5	PointPillar
Object Detection	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
Object Detection	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
Object Detection	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars
3D	nuScenes LiDAR only	NDS	45.3	PointPillar
3D	nuScenes LiDAR only	mAP	30.5	PointPillar
3D	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
3D	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
3D	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars
Birds Eye View Object Detection	KITTI Cars Hard	AP	79.83	PointPillars
3D Object Detection	nuScenes LiDAR only	NDS	45.3	PointPillar
3D Object Detection	nuScenes LiDAR only	mAP	30.5	PointPillar
3D Object Detection	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
3D Object Detection	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
3D Object Detection	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars
2D Classification	nuScenes LiDAR only	NDS	45.3	PointPillar
2D Classification	nuScenes LiDAR only	mAP	30.5	PointPillar
2D Classification	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
2D Classification	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
2D Classification	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars
2D Object Detection	nuScenes LiDAR only	NDS	45.3	PointPillar
2D Object Detection	nuScenes LiDAR only	mAP	30.5	PointPillar
2D Object Detection	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
2D Object Detection	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
2D Object Detection	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars
16k	nuScenes LiDAR only	NDS	45.3	PointPillar
16k	nuScenes LiDAR only	mAP	30.5	PointPillar
16k	DAIR-V2X-I	AP\|R40(easy)	63.1	PointPillars
16k	DAIR-V2X-I	AP\|R40(hard)	54	PointPillars
16k	DAIR-V2X-I	AP\|R40(moderate)	54	PointPillars

PointPillars: Fast Encoders for Object Detection from Point Clouds

Abstract

Results

Related Papers

PointPillars: Fast Encoders for Object Detection from Point Clouds

Abstract

Results

Related Papers