Learning Video Object Segmentation from Unlabeled Videos

Xiankai Lu, Wenguan Wang, Jianbing Shen, Yu-Wing Tai, David Crandall, Steven C. H. Hoi

2020-03-10CVPR 2020 6Unsupervised Video Object Segmentation Semi-Supervised Video Object Segmentation Representation Learning Segmentation Semantic Segmentation Video Object Segmentation Video Semantic Segmentation

Paper PDF Code(official)

Abstract

We propose a new method for video object segmentation (VOS) that addresses object pattern learning from unlabeled videos, unlike most existing methods which rely heavily on extensive annotated data. We introduce a unified unsupervised/weakly supervised learning framework, called MuG, that comprehensively captures intrinsic properties of VOS at multiple granularities. Our approach can help advance understanding of visual patterns in VOS and significantly reduce annotation burden. With a carefully-designed architecture and strong representation learning ability, our learned model can be applied to diverse VOS settings, including object-level zero-shot VOS, instance-level zero-shot VOS, and one-shot VOS. Experiments demonstrate promising performance in these settings, as well as the potential of MuG in leveraging unlabeled data to further improve the segmentation accuracy.

Results

Task	Dataset	Metric	Value	Model
Video	DAVIS 2017 (val)	F-measure (Decay)	37.4	MuG-W
Video	DAVIS 2017 (val)	F-measure (Mean)	58	MuG-W
Video	DAVIS 2017 (val)	F-measure (Recall)	62.2	MuG-W
Video	DAVIS 2017 (val)	J&F	56.05	MuG-W
Video	DAVIS 2017 (val)	Jaccard (Decay)	32.5	MuG-W
Video	DAVIS 2017 (val)	Jaccard (Mean)	54.1	MuG-W
Video	DAVIS 2017 (val)	Jaccard (Recall)	60.5	MuG-W
Video	DAVIS 2016	F-measure (Decay)	27.2	MuG-W
Video	DAVIS 2016	F-measure (Mean)	63.6	MuG-W
Video	DAVIS 2016	F-measure (Recall)	67.7	MuG-W
Video	DAVIS 2016	J&F	64.65	MuG-W
Video	DAVIS 2016	Jaccard (Decay)	26.4	MuG-W
Video	DAVIS 2016	Jaccard (Mean)	65.7	MuG-W
Video	DAVIS 2016	Jaccard (Recall)	77.7	MuG-W
Video	DAVIS 2017 (test-dev)	F-measure (Decay)	-1.7	MuG-W
Video	DAVIS 2017 (test-dev)	F-measure (Mean)	44.5	MuG-W
Video	DAVIS 2017 (test-dev)	F-measure (Recall)	46.6	MuG-W
Video	DAVIS 2017 (test-dev)	J&F	41.7	MuG-W
Video	DAVIS 2017 (test-dev)	Jaccard (Decay)	-2.7	MuG-W
Video	DAVIS 2017 (test-dev)	Jaccard (Mean)	38.9	MuG-W
Video	DAVIS 2017 (test-dev)	Jaccard (Recall)	44.3	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	F-measure (Decay)	37.4	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	F-measure (Mean)	58	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	F-measure (Recall)	62.2	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	J&F	56.05	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Decay)	32.5	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Mean)	54.1	MuG-W
Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Recall)	60.5	MuG-W
Video Object Segmentation	DAVIS 2016	F-measure (Decay)	27.2	MuG-W
Video Object Segmentation	DAVIS 2016	F-measure (Mean)	63.6	MuG-W
Video Object Segmentation	DAVIS 2016	F-measure (Recall)	67.7	MuG-W
Video Object Segmentation	DAVIS 2016	J&F	64.65	MuG-W
Video Object Segmentation	DAVIS 2016	Jaccard (Decay)	26.4	MuG-W
Video Object Segmentation	DAVIS 2016	Jaccard (Mean)	65.7	MuG-W
Video Object Segmentation	DAVIS 2016	Jaccard (Recall)	77.7	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	F-measure (Decay)	-1.7	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	F-measure (Mean)	44.5	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	F-measure (Recall)	46.6	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	J&F	41.7	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	Jaccard (Decay)	-2.7	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	Jaccard (Mean)	38.9	MuG-W
Video Object Segmentation	DAVIS 2017 (test-dev)	Jaccard (Recall)	44.3	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	F-measure (Decay)	37.4	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	F-measure (Mean)	58	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	F-measure (Recall)	62.2	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	J&F	56.05	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Decay)	32.5	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Mean)	54.1	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2017 (val)	Jaccard (Recall)	60.5	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	F-measure (Decay)	27.2	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	F-measure (Mean)	63.6	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	F-measure (Recall)	67.7	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	J&F	64.65	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	Jaccard (Decay)	26.4	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	Jaccard (Mean)	65.7	MuG-W
Semi-Supervised Video Object Segmentation	DAVIS 2016	Jaccard (Recall)	77.7	MuG-W

Learning Video Object Segmentation from Unlabeled Videos

Abstract

Results

Related Papers

Learning Video Object Segmentation from Unlabeled Videos

Abstract

Results

Related Papers