Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation

Jaehyeong Jeon, Kibum Kim, Kanghoon Yoon, Chanyoung Park

2024-07-22Scene Graph Generation Graph Generation Unbiased Scene Graph Generation

Abstract

The scene graph generation (SGG) task involves detecting objects within an image and predicting predicates that represent the relationships between the objects. However, in SGG benchmark datasets, each subject-object pair is annotated with a single predicate even though a single predicate may exhibit diverse semantics (i.e., semantic diversity), existing SGG models are trained to predict the one and only predicate for each pair. This in turn results in the SGG models to overlook the semantic diversity that may exist in a predicate, thus leading to biased predictions. In this paper, we propose a novel model-agnostic Semantic Diversity-aware Prototype-based Learning (DPL) framework that enables unbiased predictions based on the understanding of the semantic diversity of predicates. Specifically, DPL learns the regions in the semantic space covered by each predicate to distinguish among the various different semantics that a single predicate can represent. Extensive experiments demonstrate that our proposed model-agnostic DPL framework brings significant performance improvement on existing SGG models, and also effectively understands the semantic diversity of predicates.

Results

Task	Dataset	Metric	Value	Model
Scene Parsing	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Parsing	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Parsing	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)

Abstract

Results

Task	Dataset	Metric	Value	Model
Scene Parsing	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Parsing	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Parsing	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Parsing	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Parsing	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
2D Semantic Segmentation	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
2D Semantic Segmentation	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
2D Semantic Segmentation	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	F@100	44.9	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	mR@20	26.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	ng-mR@20	31.3	DPL (MOTIFS-ResNeXt-101-FPN backbone; PredCls mode)
Scene Graph Generation	Visual Genome	F@100	25.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	mR@20	14.1	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	ng-mR@20	18.5	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGCls mode)
Scene Graph Generation	Visual Genome	F@100	20.2	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	mR@20	9.4	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)
Scene Graph Generation	Visual Genome	ng-mR@20	10	DPL (MOTIFS-ResNeXt-101-FPN backbone; SGDet mode)

Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation

Abstract

Results

Related Papers

Semantic Diversity-aware Prototype-based Learning for Unbiased Scene Graph Generation

Abstract

Results

Related Papers