AttentiveNAS: Improving Neural Architecture Search via Attentive Sampling

Dilin Wang, Meng Li, Chengyue Gong, Vikas Chandra

2020-11-18CVPR 2021 1Neural Architecture Search

Abstract

Neural architecture search (NAS) has shown great promise in designing state-of-the-art (SOTA) models that are both accurate and efficient. Recently, two-stage NAS, e.g. BigNAS, decouples the model training and searching process and achieves remarkable search efficiency and accuracy. Two-stage NAS requires sampling from the search space during training, which directly impacts the accuracy of the final searched models. While uniform sampling has been widely used for its simplicity, it is agnostic of the model performance Pareto front, which is the main focus in the search process, and thus, misses opportunities to further improve the model accuracy. In this work, we propose AttentiveNAS that focuses on improving the sampling strategy to achieve better performance Pareto. We also propose algorithms to efficiently and effectively identify the networks on the Pareto during training. Without extra re-training or post-processing, we can simultaneously obtain a large number of networks across a wide range of FLOPs. Our discovered model family, AttentiveNAS models, achieves top-1 accuracy from 77.3% to 80.7% on ImageNet, and outperforms SOTA models, including BigNAS and Once-for-All networks. We also achieve ImageNet accuracy of 80.1% with only 491 MFLOPs. Our training code and pretrained models are available at https://github.com/facebookresearch/AttentiveNAS.

Results

Task	Dataset	Metric	Value	Model
Neural Architecture Search	ImageNet	Accuracy	80.1	AttentiveNAS-A5
Neural Architecture Search	ImageNet	Top-1 Error Rate	19.9	AttentiveNAS-A5
Neural Architecture Search	ImageNet	Accuracy	79.8	AttentiveNAS-A4
Neural Architecture Search	ImageNet	Top-1 Error Rate	20.2	AttentiveNAS-A4
Neural Architecture Search	ImageNet	Accuracy	79.1	AttentiveNAS-A3
Neural Architecture Search	ImageNet	Top-1 Error Rate	20.9	AttentiveNAS-A3
Neural Architecture Search	ImageNet	Accuracy	78.8	AttentiveNAS-A2
Neural Architecture Search	ImageNet	Top-1 Error Rate	21.2	AttentiveNAS-A2
Neural Architecture Search	ImageNet	Accuracy	78.4	AttentiveNAS-A1
Neural Architecture Search	ImageNet	Top-1 Error Rate	21.6	AttentiveNAS-A1
Neural Architecture Search	ImageNet	Accuracy	77.3	AttentiveNAS-A0
Neural Architecture Search	ImageNet	Top-1 Error Rate	22.7	AttentiveNAS-A0
AutoML	ImageNet	Accuracy	80.1	AttentiveNAS-A5
AutoML	ImageNet	Top-1 Error Rate	19.9	AttentiveNAS-A5
AutoML	ImageNet	Accuracy	79.8	AttentiveNAS-A4
AutoML	ImageNet	Top-1 Error Rate	20.2	AttentiveNAS-A4
AutoML	ImageNet	Accuracy	79.1	AttentiveNAS-A3
AutoML	ImageNet	Top-1 Error Rate	20.9	AttentiveNAS-A3
AutoML	ImageNet	Accuracy	78.8	AttentiveNAS-A2
AutoML	ImageNet	Top-1 Error Rate	21.2	AttentiveNAS-A2
AutoML	ImageNet	Accuracy	78.4	AttentiveNAS-A1
AutoML	ImageNet	Top-1 Error Rate	21.6	AttentiveNAS-A1
AutoML	ImageNet	Accuracy	77.3	AttentiveNAS-A0
AutoML	ImageNet	Top-1 Error Rate	22.7	AttentiveNAS-A0

AttentiveNAS: Improving Neural Architecture Search via Attentive Sampling

Abstract

Results

Related Papers

AttentiveNAS: Improving Neural Architecture Search via Attentive Sampling

Abstract

Results

Related Papers