GPSA

Gated Positional Self-Attention

GeneralIntroduced 20003 papers

Description

Gated Positional Self-Attention (GPSA) is a self-attention module for vision transformers, used in the ConViT architecture, that can be initialized as a convolutional layer -- helping a ViT learn inductive biases about locality.

Papers Using This Method

What do Vision Transformers Learn? A Visual Exploration2022-12-13 Conviformers: Convolutionally guided Vision Transformer2022-08-17 ConViT: Improving Vision Transformers with Soft Convolutional Inductive Biases2021-03-19