3D Dual-Fusion: Dual-Domain Dual-Query Camera-LiDAR Fusion for 3D Object Detection

Yecheol Kim, Konyul Park, Minwook Kim, Dongsuk Kum, Jun Won Choi

2022-11-24object-detection Robust 3D Object Detection 3D Object Detection Object Detection

Abstract

Fusing data from cameras and LiDAR sensors is an essential technique to achieve robust 3D object detection. One key challenge in camera-LiDAR fusion involves mitigating the large domain gap between the two sensors in terms of coordinates and data distribution when fusing their features. In this paper, we propose a novel camera-LiDAR fusion architecture called, 3D Dual-Fusion, which is designed to mitigate the gap between the feature representations of camera and LiDAR data. The proposed method fuses the features of the camera-view and 3D voxel-view domain and models their interactions through deformable attention. We redesign the transformer fusion encoder to aggregate the information from the two domains. Two major changes include 1) dual query-based deformable attention to fuse the dual-domain features interactively and 2) 3D local self-attention to encode the voxel-domain queries prior to dual-query decoding. The results of an experimental evaluation show that the proposed camera-LiDAR fusion architecture achieved competitive performance on the KITTI and nuScenes datasets, with state-of-the-art performances in some 3D object detection benchmarks categories.

Results

Task	Dataset	Metric	Value	Model
Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Classification	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Classification	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Classification	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Classification	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Classification	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Classification	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Classification	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Classification	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Classification	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Classification	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Classification	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Classification	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Classification	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Classification	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
16k	nuScenes	NDS	0.73	3D Dual-Fusion_T
16k	nuScenes	mAAE	0.13	3D Dual-Fusion_T
16k	nuScenes	mAOE	0.33	3D Dual-Fusion_T
16k	nuScenes	mAP	0.71	3D Dual-Fusion_T
16k	nuScenes	mASE	0.24	3D Dual-Fusion_T
16k	nuScenes	mATE	0.26	3D Dual-Fusion_T
16k	nuScenes	mAVE	0.27	3D Dual-Fusion_T
16k	nuScenes	NDS	0.73	3D Dual-Fusion_T
16k	nuScenes	mAAE	0.13	3D Dual-Fusion_T
16k	nuScenes	mAOE	0.33	3D Dual-Fusion_T
16k	nuScenes	mAP	0.71	3D Dual-Fusion_T
16k	nuScenes	mASE	0.24	3D Dual-Fusion_T
16k	nuScenes	mATE	0.26	3D Dual-Fusion_T
16k	nuScenes	mAVE	0.27	3D Dual-Fusion_T

Abstract

Results

Task	Dataset	Metric	Value	Model
Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
3D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
3D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
3D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
3D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Classification	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Classification	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Classification	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Classification	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Classification	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Classification	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Classification	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Classification	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Classification	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Classification	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Classification	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Classification	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Classification	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Classification	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
2D Object Detection	nuScenes	NDS	0.73	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAAE	0.13	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAOE	0.33	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAP	0.71	3D Dual-Fusion_T
2D Object Detection	nuScenes	mASE	0.24	3D Dual-Fusion_T
2D Object Detection	nuScenes	mATE	0.26	3D Dual-Fusion_T
2D Object Detection	nuScenes	mAVE	0.27	3D Dual-Fusion_T
16k	nuScenes	NDS	0.73	3D Dual-Fusion_T
16k	nuScenes	mAAE	0.13	3D Dual-Fusion_T
16k	nuScenes	mAOE	0.33	3D Dual-Fusion_T
16k	nuScenes	mAP	0.71	3D Dual-Fusion_T
16k	nuScenes	mASE	0.24	3D Dual-Fusion_T
16k	nuScenes	mATE	0.26	3D Dual-Fusion_T
16k	nuScenes	mAVE	0.27	3D Dual-Fusion_T
16k	nuScenes	NDS	0.73	3D Dual-Fusion_T
16k	nuScenes	mAAE	0.13	3D Dual-Fusion_T
16k	nuScenes	mAOE	0.33	3D Dual-Fusion_T
16k	nuScenes	mAP	0.71	3D Dual-Fusion_T
16k	nuScenes	mASE	0.24	3D Dual-Fusion_T
16k	nuScenes	mATE	0.26	3D Dual-Fusion_T
16k	nuScenes	mAVE	0.27	3D Dual-Fusion_T

3D Dual-Fusion: Dual-Domain Dual-Query Camera-LiDAR Fusion for 3D Object Detection

Abstract

Results

Related Papers

3D Dual-Fusion: Dual-Domain Dual-Query Camera-LiDAR Fusion for 3D Object Detection

Abstract

Results

Related Papers