PO3D-VQA

Parts, Poses, and Occlusions in 3D Visual Question Answering

Computer VisionIntroduced 20001 papers

Description

A VQA model that marries two powerful ideas: probabilistic neural symbolic program execution for reasoning and a deep neural network with 3D generative representations of objects for robust visual scene parsing.

Papers Using This Method

3D-Aware Visual Question Answering about Parts, Poses and Occlusions2023-10-27