MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation

Yong Yang, Qiong Chen, Yuan Feng, Tianlin Huang

2023-05-23CVPR 2023 1Meta-Learning Few-Shot Semantic Segmentation Semantic Segmentation Word Embeddings General Knowledge

Paper PDF Code(official)

Abstract

Existing few-shot segmentation methods are based on the meta-learning strategy and extract instance knowledge from a support set and then apply the knowledge to segment target objects in a query set. However, the extracted knowledge is insufficient to cope with the variable intra-class differences since the knowledge is obtained from a few samples in the support set. To address the problem, we propose a multi-information aggregation network (MIANet) that effectively leverages the general knowledge, i.e., semantic word embeddings, and instance information for accurate segmentation. Specifically, in MIANet, a general information module (GIM) is proposed to extract a general class prototype from word embeddings as a supplement to instance information. To this end, we design a triplet loss that treats the general class prototype as an anchor and samples positive-negative pairs from local features in the support set. The calculated triplet loss can transfer semantic similarities among language identities from a word embedding space to a visual representation space. To alleviate the model biasing towards the seen training classes and to obtain multi-scale information, we then introduce a non-parametric hierarchical prior module (HPM) to generate unbiased instance-level information via calculating the pixel-level similarity between the support and query image features. Finally, an information fusion module (IFM) combines the general and instance information to make predictions for the query image. Extensive experiments on PASCAL-5i and COCO-20i show that MIANet yields superior performance and set a new state-of-the-art. Code is available at https://github.com/Aldrich2y/MIANet.

Results

Task	Dataset	Metric	Value	Model
Few-Shot Learning	COCO-20i (5-shot)	FB-IoU	73.13	MIANet (ResNet-50)
Few-Shot Learning	COCO-20i (5-shot)	Mean IoU	51.65	MIANet (ResNet-50)
Few-Shot Learning	COCO-20i (5-shot)	FB-IoU	73.81	MIANet (VGG-16)
Few-Shot Learning	COCO-20i (5-shot)	Mean IoU	51.03	MIANet (VGG-16)
Few-Shot Learning	PASCAL-5i (1-Shot)	FB-IoU	79.54	MIANet (ResNet-50)
Few-Shot Learning	PASCAL-5i (1-Shot)	Mean IoU	68.72	MIANet (ResNet-50)
Few-Shot Learning	PASCAL-5i (1-Shot)	Mean IoU	67.63	MIANet (ResNet-101)
Few-Shot Learning	PASCAL-5i (1-Shot)	FB-IoU	79.22	MIANet (VGG-16)
Few-Shot Learning	PASCAL-5i (1-Shot)	Mean IoU	67.1	MIANet (VGG-16)
Few-Shot Learning	COCO-20i (1-shot)	FB-IoU	71.51	MIANet (ResNet-50)
Few-Shot Learning	COCO-20i (1-shot)	Mean IoU	47.66	MIANet (ResNet-50)
Few-Shot Learning	COCO-20i (1-shot)	FB-IoU	71.01	MIANet (VGG-16)
Few-Shot Learning	COCO-20i (1-shot)	Mean IoU	45.69	MIANet (VGG-16)
Few-Shot Learning	PASCAL-5i (5-Shot)	FB-IoU	82.69	MIANet (VGG-16)
Few-Shot Learning	PASCAL-5i (5-Shot)	Mean IoU	71.99	MIANet (VGG-16)
Few-Shot Learning	PASCAL-5i (5-Shot)	FB-IoU	82.2	MIANet (ResNet-50)
Few-Shot Learning	PASCAL-5i (5-Shot)	Mean IoU	71.59	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	COCO-20i (5-shot)	FB-IoU	73.13	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	COCO-20i (5-shot)	Mean IoU	51.65	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	COCO-20i (5-shot)	FB-IoU	73.81	MIANet (VGG-16)
Few-Shot Semantic Segmentation	COCO-20i (5-shot)	Mean IoU	51.03	MIANet (VGG-16)
Few-Shot Semantic Segmentation	PASCAL-5i (1-Shot)	FB-IoU	79.54	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	PASCAL-5i (1-Shot)	Mean IoU	68.72	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	PASCAL-5i (1-Shot)	Mean IoU	67.63	MIANet (ResNet-101)
Few-Shot Semantic Segmentation	PASCAL-5i (1-Shot)	FB-IoU	79.22	MIANet (VGG-16)
Few-Shot Semantic Segmentation	PASCAL-5i (1-Shot)	Mean IoU	67.1	MIANet (VGG-16)
Few-Shot Semantic Segmentation	COCO-20i (1-shot)	FB-IoU	71.51	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	COCO-20i (1-shot)	Mean IoU	47.66	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	COCO-20i (1-shot)	FB-IoU	71.01	MIANet (VGG-16)
Few-Shot Semantic Segmentation	COCO-20i (1-shot)	Mean IoU	45.69	MIANet (VGG-16)
Few-Shot Semantic Segmentation	PASCAL-5i (5-Shot)	FB-IoU	82.69	MIANet (VGG-16)
Few-Shot Semantic Segmentation	PASCAL-5i (5-Shot)	Mean IoU	71.99	MIANet (VGG-16)
Few-Shot Semantic Segmentation	PASCAL-5i (5-Shot)	FB-IoU	82.2	MIANet (ResNet-50)
Few-Shot Semantic Segmentation	PASCAL-5i (5-Shot)	Mean IoU	71.59	MIANet (ResNet-50)
Meta-Learning	COCO-20i (5-shot)	FB-IoU	73.13	MIANet (ResNet-50)
Meta-Learning	COCO-20i (5-shot)	Mean IoU	51.65	MIANet (ResNet-50)
Meta-Learning	COCO-20i (5-shot)	FB-IoU	73.81	MIANet (VGG-16)
Meta-Learning	COCO-20i (5-shot)	Mean IoU	51.03	MIANet (VGG-16)
Meta-Learning	PASCAL-5i (1-Shot)	FB-IoU	79.54	MIANet (ResNet-50)
Meta-Learning	PASCAL-5i (1-Shot)	Mean IoU	68.72	MIANet (ResNet-50)
Meta-Learning	PASCAL-5i (1-Shot)	Mean IoU	67.63	MIANet (ResNet-101)
Meta-Learning	PASCAL-5i (1-Shot)	FB-IoU	79.22	MIANet (VGG-16)
Meta-Learning	PASCAL-5i (1-Shot)	Mean IoU	67.1	MIANet (VGG-16)
Meta-Learning	COCO-20i (1-shot)	FB-IoU	71.51	MIANet (ResNet-50)
Meta-Learning	COCO-20i (1-shot)	Mean IoU	47.66	MIANet (ResNet-50)
Meta-Learning	COCO-20i (1-shot)	FB-IoU	71.01	MIANet (VGG-16)
Meta-Learning	COCO-20i (1-shot)	Mean IoU	45.69	MIANet (VGG-16)
Meta-Learning	PASCAL-5i (5-Shot)	FB-IoU	82.69	MIANet (VGG-16)
Meta-Learning	PASCAL-5i (5-Shot)	Mean IoU	71.99	MIANet (VGG-16)
Meta-Learning	PASCAL-5i (5-Shot)	FB-IoU	82.2	MIANet (ResNet-50)
Meta-Learning	PASCAL-5i (5-Shot)	Mean IoU	71.59	MIANet (ResNet-50)

MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation

Abstract

Results

Related Papers

MIANet: Aggregating Unbiased Instance and General Information for Few-Shot Semantic Segmentation

Abstract

Results

Related Papers