Learning Discriminative Model Prediction for Tracking

Goutam Bhat, Martin Danelljan, Luc van Gool, Radu Timofte

2019-04-15ICCV 2019 10Visual Object Tracking Visual Tracking Prediction Object Tracking Video Object Tracking

Abstract

The current strive towards end-to-end trainable computer vision systems imposes major challenges for the task of visual tracking. In contrast to most other vision problems, tracking requires the learning of a robust target-specific appearance model online, during the inference stage. To be end-to-end trainable, the online learning of the target model thus needs to be embedded in the tracking architecture itself. Due to the imposed challenges, the popular Siamese paradigm simply predicts a target feature template, while ignoring the background appearance information during inference. Consequently, the predicted model possesses limited target-background discriminability. We develop an end-to-end tracking architecture, capable of fully exploiting both target and background appearance information for target model prediction. Our architecture is derived from a discriminative learning loss by designing a dedicated optimization process that is capable of predicting a powerful model in only a few iterations. Furthermore, our approach is able to learn key aspects of the discriminative loss itself. The proposed tracker sets a new state-of-the-art on 6 tracking benchmarks, achieving an EAO score of 0.440 on VOT2018, while running at over 40 FPS. The code and models are available at https://github.com/visionml/pytracking.

Results

Task	Dataset	Metric	Value	Model
Video	NT-VOT211	AUC	35.89	DiMP-50
Video	NT-VOT211	Precision	48.68	DiMP-50
Object Tracking	FE108	Averaged Precision	85.1	DiMP
Object Tracking	FE108	Success Rate	57.1	DiMP
Object Tracking	LaSOT	AUC	56.8	DiMP
Object Tracking	LaSOT	Normalized Precision	65	DiMP
Object Tracking	LaSOT	Precision	56.7	DiMP
Object Tracking	LaSOT	Precision	68.7	DiMP-50
Object Tracking	GOT-10k	Average Overlap	61.1	DiMP
Object Tracking	GOT-10k	Success Rate 0.5	71.7	DiMP
Object Tracking	TrackingNet	Accuracy	74	DiMP-50
Object Tracking	TrackingNet	Normalized Precision	80.1	DiMP-50
Object Tracking	NT-VOT211	AUC	35.89	DiMP-50
Object Tracking	NT-VOT211	Precision	48.68	DiMP-50
Visual Object Tracking	LaSOT	AUC	56.8	DiMP
Visual Object Tracking	LaSOT	Normalized Precision	65	DiMP
Visual Object Tracking	LaSOT	Precision	56.7	DiMP
Visual Object Tracking	LaSOT	Precision	68.7	DiMP-50
Visual Object Tracking	GOT-10k	Average Overlap	61.1	DiMP
Visual Object Tracking	GOT-10k	Success Rate 0.5	71.7	DiMP
Visual Object Tracking	TrackingNet	Accuracy	74	DiMP-50
Visual Object Tracking	TrackingNet	Normalized Precision	80.1	DiMP-50

Learning Discriminative Model Prediction for Tracking

Abstract

Results

Related Papers

Learning Discriminative Model Prediction for Tracking

Abstract

Results

Related Papers