Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception

Philipp Wolters, Johannes Gilg, Torben Teepe, Fabian Herzog, Anouar Laouichi, Martin Hofmann, Gerhard Rigoll

2024-03-12Prediction Of Occupancy Grid Maps 3D Object Detection (RoI)3D Semantic Occupancy Prediction Depth Prediction Autonomous Driving 3D Multi-Object Tracking 3D Object Detection

Paper PDF Code(official)

Abstract

Low-cost, vision-centric 3D perception systems for autonomous driving have made significant progress in recent years, narrowing the gap to expensive LiDAR-based methods. The primary challenge in becoming a fully reliable alternative lies in robust depth prediction capabilities, as camera-based systems struggle with long detection ranges and adverse lighting and weather conditions. In this work, we introduce HyDRa, a novel camera-radar fusion architecture for diverse 3D perception tasks. Building upon the principles of dense BEV (Bird's Eye View)-based architectures, HyDRa introduces a hybrid fusion approach to combine the strengths of complementary camera and radar features in two distinct representation spaces. Our Height Association Transformer module leverages radar features already in the perspective view to produce more robust and accurate depth predictions. In the BEV, we refine the initial sparse representation by a Radar-weighted Depth Consistency. HyDRa achieves a new state-of-the-art for camera-radar fusion of 64.2 NDS (+1.8) and 58.4 AMOTA (+1.5) on the public nuScenes dataset. Moreover, our new semantically rich and spatially accurate BEV features can be directly converted into a powerful occupancy representation, beating all previous camera-based methods on the Occ3D benchmark by an impressive 3.7 mIoU. Code and models are available at https://github.com/phi-wol/hydra.

Results

Task	Dataset	Metric	Value	Model
Multi-Object Tracking	nuscenes Camera-Radar	AMOTA	0.584	HyDRa
Multi-Object Tracking	nuScenes	AMOTA	0.584	HyDRa
Object Tracking	nuscenes Camera-Radar	AMOTA	0.584	HyDRa
Object Tracking	nuScenes	AMOTA	0.584	HyDRa
Prediction Of Occupancy Grid Maps	Occ3D-nuScenes	mIoU	44.4	HyDRa R50
Object Detection	View-of-Delft (val)	mAP	60.9	HyDRa
Object Detection	nuScenes	NDS	0.64	HyDRa
Object Detection	nuScenes	mAAE	0.12	HyDRa
Object Detection	nuScenes	mAOE	0.42	HyDRa
Object Detection	nuScenes	mAP	0.57	HyDRa
Object Detection	nuScenes	mASE	0.25	HyDRa
Object Detection	nuScenes	mATE	0.4	HyDRa
Object Detection	nuScenes	mAVE	0.25	HyDRa
Object Detection	nuscenes Camera-Radar	NDS	64.2	HyDRa
Object Detection	TruckScenes	NDS	22.4	HyDRa
Object Detection	TruckScenes	mAP	12.8	HyDRa
3D	View-of-Delft (val)	mAP	60.9	HyDRa
3D	nuScenes	NDS	0.64	HyDRa
3D	nuScenes	mAAE	0.12	HyDRa
3D	nuScenes	mAOE	0.42	HyDRa
3D	nuScenes	mAP	0.57	HyDRa
3D	nuScenes	mASE	0.25	HyDRa
3D	nuScenes	mATE	0.4	HyDRa
3D	nuScenes	mAVE	0.25	HyDRa
3D	nuscenes Camera-Radar	NDS	64.2	HyDRa
3D	TruckScenes	NDS	22.4	HyDRa
3D	TruckScenes	mAP	12.8	HyDRa
3D Object Detection	View-of-Delft (val)	mAP	60.9	HyDRa
3D Object Detection	nuScenes	NDS	0.64	HyDRa
3D Object Detection	nuScenes	mAAE	0.12	HyDRa
3D Object Detection	nuScenes	mAOE	0.42	HyDRa
3D Object Detection	nuScenes	mAP	0.57	HyDRa
3D Object Detection	nuScenes	mASE	0.25	HyDRa
3D Object Detection	nuScenes	mATE	0.4	HyDRa
3D Object Detection	nuScenes	mAVE	0.25	HyDRa
3D Object Detection	nuscenes Camera-Radar	NDS	64.2	HyDRa
3D Object Detection	TruckScenes	NDS	22.4	HyDRa
3D Object Detection	TruckScenes	mAP	12.8	HyDRa
3D Multi-Object Tracking	nuscenes Camera-Radar	AMOTA	0.584	HyDRa
3D Multi-Object Tracking	nuScenes	AMOTA	0.584	HyDRa
2D Classification	View-of-Delft (val)	mAP	60.9	HyDRa
2D Classification	nuScenes	NDS	0.64	HyDRa
2D Classification	nuScenes	mAAE	0.12	HyDRa
2D Classification	nuScenes	mAOE	0.42	HyDRa
2D Classification	nuScenes	mAP	0.57	HyDRa
2D Classification	nuScenes	mASE	0.25	HyDRa
2D Classification	nuScenes	mATE	0.4	HyDRa
2D Classification	nuScenes	mAVE	0.25	HyDRa
2D Classification	nuscenes Camera-Radar	NDS	64.2	HyDRa
2D Classification	TruckScenes	NDS	22.4	HyDRa
2D Classification	TruckScenes	mAP	12.8	HyDRa
2D Object Detection	View-of-Delft (val)	mAP	60.9	HyDRa
2D Object Detection	nuScenes	NDS	0.64	HyDRa
2D Object Detection	nuScenes	mAAE	0.12	HyDRa
2D Object Detection	nuScenes	mAOE	0.42	HyDRa
2D Object Detection	nuScenes	mAP	0.57	HyDRa
2D Object Detection	nuScenes	mASE	0.25	HyDRa
2D Object Detection	nuScenes	mATE	0.4	HyDRa
2D Object Detection	nuScenes	mAVE	0.25	HyDRa
2D Object Detection	nuscenes Camera-Radar	NDS	64.2	HyDRa
2D Object Detection	TruckScenes	NDS	22.4	HyDRa
2D Object Detection	TruckScenes	mAP	12.8	HyDRa
16k	View-of-Delft (val)	mAP	60.9	HyDRa
16k	nuScenes	NDS	0.64	HyDRa
16k	nuScenes	mAAE	0.12	HyDRa
16k	nuScenes	mAOE	0.42	HyDRa
16k	nuScenes	mAP	0.57	HyDRa
16k	nuScenes	mASE	0.25	HyDRa
16k	nuScenes	mATE	0.4	HyDRa
16k	nuScenes	mAVE	0.25	HyDRa
16k	nuscenes Camera-Radar	NDS	64.2	HyDRa
16k	TruckScenes	NDS	22.4	HyDRa
16k	TruckScenes	mAP	12.8	HyDRa

Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception

Abstract

Results

Related Papers

Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception

Abstract

Results

Related Papers