SCAN: Learning to Classify Images without Labels

Wouter Van Gansbeke, Simon Vandenhende, Stamatios Georgoulis, Marc Proesmans, Luc van Gool

2020-05-25ECCV 2020 8Image Classification Representation Learning Image Clustering Clustering General Classification Classification Unsupervised Image Classification Semi-Supervised Image Classification

Paper PDF Code Code(official)

Abstract

Can we automatically group images into semantically meaningful clusters when ground-truth annotations are absent? The task of unsupervised image classification remains an important, and open challenge in computer vision. Several recent approaches have tried to tackle this problem in an end-to-end fashion. In this paper, we deviate from recent works, and advocate a two-step approach where feature learning and clustering are decoupled. First, a self-supervised task from representation learning is employed to obtain semantically meaningful features. Second, we use the obtained features as a prior in a learnable clustering approach. In doing so, we remove the ability for cluster learning to depend on low-level features, which is present in current end-to-end learning approaches. Experimental evaluation shows that we outperform state-of-the-art methods by large margins, in particular +26.6% on CIFAR10, +25.0% on CIFAR100-20 and +21.3% on STL10 in terms of classification accuracy. Furthermore, our method is the first to perform well on a large-scale dataset for image classification. In particular, we obtain promising results on ImageNet, and outperform several semi-supervised learning methods in the low-data regime without the use of any ground-truth annotations. The code is made publicly available at https://github.com/wvangansbeke/Unsupervised-Classification.

Results

Task	Dataset	Metric	Value	Model
Image Clustering	ImageNet-100 (TEMI Split)	ACCURACY	0.662	SCAN
Image Clustering	ImageNet-100 (TEMI Split)	ARI	0.544	SCAN
Image Clustering	ImageNet-100 (TEMI Split)	NMI	0.787	SCAN
Image Clustering	CIFAR-10	ARI	0.772	SCAN
Image Clustering	CIFAR-10	Accuracy	0.883	SCAN
Image Clustering	CIFAR-10	NMI	0.797	SCAN
Image Clustering	CIFAR-10	ARI	0.758	SCAN (Avg)
Image Clustering	CIFAR-10	Accuracy	0.876	SCAN (Avg)
Image Clustering	CIFAR-10	NMI	0.787	SCAN (Avg)
Image Clustering	CIFAR-100	ARI	0.333	SCAN
Image Clustering	CIFAR-100	Accuracy	0.507	SCAN
Image Clustering	CIFAR-100	NMI	0.486	SCAN
Image Clustering	CIFAR-100	ARI	0.301	SCAN (Avg)
Image Clustering	CIFAR-100	Accuracy	0.459	SCAN (Avg)
Image Clustering	CIFAR-100	NMI	0.468	SCAN (Avg)
Image Clustering	ImageNet-200	ACCURACY	0.563	SCAN
Image Clustering	ImageNet-200	ARI	0.441	SCAN
Image Clustering	ImageNet-200	NMI	0.757	SCAN
Image Clustering	ImageNet-50 (TEMI Split)	ACCURACY	0.751	SCAN
Image Clustering	ImageNet-50 (TEMI Split)	ARI	0.635	SCAN
Image Clustering	ImageNet-50 (TEMI Split)	NMI	0.805	SCAN
Image Clustering	STL-10	Accuracy	0.809	SCAN
Image Clustering	STL-10	NMI	0.698	SCAN
Image Clustering	STL-10	Accuracy	0.767	SCAN (Avg)
Image Clustering	STL-10	NMI	0.68	SCAN (Avg)
Image Clustering	ImageNet	Accuracy	39.9	SCAN
Image Clustering	ImageNet	NMI	72	SCAN
Image Classification	STL-10	Accuracy	80.9	SCAN
Image Classification	CIFAR-10	Accuracy	88.3	SCAN
Image Classification	CIFAR-20	Accuracy	50.7	SCAN
Image Classification	ImageNet	ARI	27.5	SCAN (ResNet-50)
Image Classification	ImageNet	Accuracy (%)	39.9	SCAN (ResNet-50)

SCAN: Learning to Classify Images without Labels

Abstract

Results

Related Papers

SCAN: Learning to Classify Images without Labels

Abstract

Results

Related Papers