Diffusion Action Segmentation

Daochang Liu, Qiyue Li, AnhDung Dinh, Tingting Jiang, Mubarak Shah, Chang Xu

2023-03-31ICCV 2023 1Denoising Action Segmentation Temporal Action Segmentation Segmentation

Abstract

Temporal action segmentation is crucial for understanding long-form videos. Previous works on this task commonly adopt an iterative refinement paradigm by using multi-stage models. We propose a novel framework via denoising diffusion models, which nonetheless shares the same inherent spirit of such iterative refinement. In this framework, action predictions are iteratively generated from random noise with input video features as conditions. To enhance the modeling of three striking characteristics of human actions, including the position prior, the boundary ambiguity, and the relational dependency, we devise a unified masking strategy for the conditioning inputs in our framework. Extensive experiments on three benchmark datasets, i.e., GTEA, 50Salads, and Breakfast, are performed and the proposed method achieves superior or comparable results to state-of-the-art methods, showing the effectiveness of a generative approach for action segmentation.

Results

Task	Dataset	Metric	Value	Model
Action Localization	50 Salads	Acc	88.9	DiffAct
Action Localization	50 Salads	Edit	85	DiffAct
Action Localization	50 Salads	F1@10%	90.1	DiffAct
Action Localization	50 Salads	F1@25%	89.2	DiffAct
Action Localization	50 Salads	F1@50%	83.7	DiffAct
Action Localization	GTEA	Acc	82.2	DiffAct
Action Localization	GTEA	Edit	89.6	DiffAct
Action Localization	GTEA	F1@10%	92.5	DiffAct
Action Localization	GTEA	F1@25%	91.5	DiffAct
Action Localization	GTEA	F1@50%	84.7	DiffAct
Action Localization	Breakfast	Acc	76.4	DiffAct
Action Localization	Breakfast	Average F1	73.6	DiffAct
Action Localization	Breakfast	Edit	78.4	DiffAct
Action Localization	Breakfast	F1@10%	80.3	DiffAct
Action Localization	Breakfast	F1@25%	75.9	DiffAct
Action Localization	Breakfast	F1@50%	64.6	DiffAct
Action Segmentation	50 Salads	Acc	88.9	DiffAct
Action Segmentation	50 Salads	Edit	85	DiffAct
Action Segmentation	50 Salads	F1@10%	90.1	DiffAct
Action Segmentation	50 Salads	F1@25%	89.2	DiffAct
Action Segmentation	50 Salads	F1@50%	83.7	DiffAct
Action Segmentation	GTEA	Acc	82.2	DiffAct
Action Segmentation	GTEA	Edit	89.6	DiffAct
Action Segmentation	GTEA	F1@10%	92.5	DiffAct
Action Segmentation	GTEA	F1@25%	91.5	DiffAct
Action Segmentation	GTEA	F1@50%	84.7	DiffAct
Action Segmentation	Breakfast	Acc	76.4	DiffAct
Action Segmentation	Breakfast	Average F1	73.6	DiffAct
Action Segmentation	Breakfast	Edit	78.4	DiffAct
Action Segmentation	Breakfast	F1@10%	80.3	DiffAct
Action Segmentation	Breakfast	F1@25%	75.9	DiffAct
Action Segmentation	Breakfast	F1@50%	64.6	DiffAct

Diffusion Action Segmentation

Abstract

Results

Related Papers

Diffusion Action Segmentation

Abstract

Results

Related Papers