BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture Search

Changlin Li, Tao Tang, Guangrun Wang, Jiefeng Peng, Bing Wang, Xiaodan Liang, Xiaojun Chang

2021-03-23ICCV 2021 10Image Classification Open-Ended Question Answering Neural Architecture Search

Abstract

A myriad of recent breakthroughs in hand-crafted neural architectures for visual recognition have highlighted the urgent need to explore hybrid architectures consisting of diversified building blocks. Meanwhile, neural architecture search methods are surging with an expectation to reduce human efforts. However, whether NAS methods can efficiently and effectively handle diversified search spaces with disparate candidates (e.g. CNNs and transformers) is still an open question. In this work, we present Block-wisely Self-supervised Neural Architecture Search (BossNAS), an unsupervised NAS method that addresses the problem of inaccurate architecture rating caused by large weight-sharing space and biased supervision in previous methods. More specifically, we factorize the search space into blocks and utilize a novel self-supervised training scheme, named ensemble bootstrapping, to train each block separately before searching them as a whole towards the population center. Additionally, we present HyTra search space, a fabric-like hybrid CNN-transformer search space with searchable down-sampling positions. On this challenging search space, our searched model, BossNet-T, achieves up to 82.5% accuracy on ImageNet, surpassing EfficientNet by 2.4% with comparable compute time. Moreover, our method achieves superior architecture rating accuracy with 0.78 and 0.76 Spearman correlation on the canonical MBConv search space with ImageNet and on NATS-Bench size search space with CIFAR-100, respectively, surpassing state-of-the-art NAS methods. Code: https://github.com/changlin31/BossNAS

Results

Task	Dataset	Metric	Value	Model
Neural Architecture Search	NATS-Bench Size, CIFAR-10	Acc. (test)	93.29	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-10	Kendall's Tau	0.53	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-10	Pearson R	0.72	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-10	Spearman's Rho	0.73	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-100	Acc. (test)	70.86	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-100	Kendall's Tau	0.59	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-100	Pearson R	0.79	BossNAS
Neural Architecture Search	NATS-Bench Size, CIFAR-100	Spearman's Rho	0.76	BossNAS
Neural Architecture Search	ImageNet	Accuracy	82.2	BossNet-T1+
Neural Architecture Search	ImageNet	Top-1 Error Rate	17.8	BossNet-T1+
Image Classification	ImageNet	GFLOPs	15.8	BossNet-T1
AutoML	NATS-Bench Size, CIFAR-10	Acc. (test)	93.29	BossNAS
AutoML	NATS-Bench Size, CIFAR-10	Kendall's Tau	0.53	BossNAS
AutoML	NATS-Bench Size, CIFAR-10	Pearson R	0.72	BossNAS
AutoML	NATS-Bench Size, CIFAR-10	Spearman's Rho	0.73	BossNAS
AutoML	NATS-Bench Size, CIFAR-100	Acc. (test)	70.86	BossNAS
AutoML	NATS-Bench Size, CIFAR-100	Kendall's Tau	0.59	BossNAS
AutoML	NATS-Bench Size, CIFAR-100	Pearson R	0.79	BossNAS
AutoML	NATS-Bench Size, CIFAR-100	Spearman's Rho	0.76	BossNAS
AutoML	ImageNet	Accuracy	82.2	BossNet-T1+
AutoML	ImageNet	Top-1 Error Rate	17.8	BossNet-T1+

BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture Search

Abstract

Results

Related Papers

BossNAS: Exploring Hybrid CNN-transformers with Block-wisely Self-supervised Neural Architecture Search

Abstract

Results

Related Papers