Feature Quantization Improves GAN Training

Yang Zhao, Chunyuan Li, Ping Yu, Jianfeng Gao, Changyou Chen

2020-04-05ICML 2020 1Unsupervised Image-To-Image Translation Quantization Translation Image Generation Face Generation Conditional Image Generation Image-to-Image Translation

Paper PDF Code(official)Code

Abstract

The instability in GAN training has been a long-standing problem despite remarkable research efforts. We identify that instability issues stem from difficulties of performing feature matching with mini-batch statistics, due to a fragile balance between the fixed target distribution and the progressively generated distribution. In this work, we propose Feature Quantization (FQ) for the discriminator, to embed both true and fake data samples into a shared discrete space. The quantized values of FQ are constructed as an evolving dictionary, which is consistent with feature statistics of the recent distribution history. Hence, FQ implicitly enables robust feature matching in a compact space. Our method can be easily plugged into existing GAN models, with little computational overhead in training. We apply FQ to 3 representative GAN models on 9 benchmarks: BigGAN for image generation, StyleGAN for face synthesis, and U-GAT-IT for unsupervised image-to-image translation. Extensive experimental results show that the proposed FQ-GAN can improve the FID scores of baseline methods by a large margin on a variety of tasks, achieving new state-of-the-art performance.

Results

Task	Dataset	Metric	Value	Model
Image-to-Image Translation	anime-to-selfie	Kernel Inception Distance	10.23	FQ-GAN
Image-to-Image Translation	selfie-to-anime	Kernel Inception Distance	11.4	FQ-GAN
Image Generation	FFHQ 1024 x 1024	FID	3.19	FQ-GAN
Image Generation	anime-to-selfie	Kernel Inception Distance	10.23	FQ-GAN
Image Generation	selfie-to-anime	Kernel Inception Distance	11.4	FQ-GAN
Image Generation	CIFAR-10	FID	5.34	FQ-GAN
Image Generation	CIFAR-10	Inception score	8.5	FQ-GAN
Image Generation	CIFAR-100	FID	7.15	FQ-GAN
Image Generation	CIFAR-100	Inception Score	9.74	FQ-GAN
Image Generation	ImageNet 64x64	FID	9.67	FQ-GAN
Image Generation	ImageNet 64x64	Inception score	25.96	FQ-GAN
Image Generation	ImageNet 128x128	FID	13.77	FQ-GAN
Image Generation	ImageNet 128x128	Inception score	54.36	FQ-GAN
Conditional Image Generation	CIFAR-10	FID	5.34	FQ-GAN
Conditional Image Generation	CIFAR-10	Inception score	8.5	FQ-GAN
Conditional Image Generation	CIFAR-100	FID	7.15	FQ-GAN
Conditional Image Generation	CIFAR-100	Inception Score	9.74	FQ-GAN
Conditional Image Generation	ImageNet 64x64	FID	9.67	FQ-GAN
Conditional Image Generation	ImageNet 64x64	Inception score	25.96	FQ-GAN
Conditional Image Generation	ImageNet 128x128	FID	13.77	FQ-GAN
Conditional Image Generation	ImageNet 128x128	Inception score	54.36	FQ-GAN
1 Image, 2*2 Stitching	anime-to-selfie	Kernel Inception Distance	10.23	FQ-GAN
1 Image, 2*2 Stitching	selfie-to-anime	Kernel Inception Distance	11.4	FQ-GAN

Feature Quantization Improves GAN Training

Abstract

Results

Related Papers

Feature Quantization Improves GAN Training

Abstract

Results

Related Papers