Cross-Modal Information Retrieval

60 benchmarks16 papers

Cross-Modal Information Retrieval (CMIR) is the task of finding relevant items across different modalities. For example, given an image, find a text or vice versa. The main challenge in CMIR is known as the heterogeneity gap: since items from different modalities have different data types, the similarity between them cannot be measured directly. Therefore, the majority of CMIR methods published to date attempt to bridge this gap by learning a latent representation space, where the similarity between items from different modalities can be measured.

<span class="description-source">Source: Scene-centric vs. Object-centric Image-Text Cross-modal Retrieval: A Reproducibility Study</span>

Benchmarks

Cross-Modal Information Retrieval

Benchmarks

Cross-Modal Information Retrieval on COCO 2014

Cross-Modal Information Retrieval on Flickr30k

Cross-Modal Information Retrieval on COCO-Noisy

Cross-Modal Information Retrieval on Flickr30K-Noisy

Cross-Modal Information Retrieval on CC152K

Cross-Modal Information Retrieval on ChEBI-20

Cross-Modal Information Retrieval on Recipe1M

Cross-Modal Information Retrieval on CommercialAdsDataset

Cross-Modal Information Retrieval on ITCPR dataset

Cross-Modal Information Retrieval on MSCOCO-1k

Cross-Modal Information Retrieval on Recipe1M+

Cross-Modal Information Retrieval on SoundingEarth

Cross-Modal Information Retrieval on CUHK-PEDES

Cross-Modal Information Retrieval on Flickr-8k

Cross-Modal Information Retrieval on MS-COCO-2014

Cross-Modal Information Retrieval on MSCOCO

Cross-Modal Information Retrieval on RSICD

Cross-Modal Information Retrieval on RSITMD

Cross-Modal Information Retrieval

Benchmarks

Cross-Modal Information Retrieval on COCO 2014

Cross-Modal Information Retrieval on Flickr30k

Cross-Modal Information Retrieval on COCO-Noisy

Cross-Modal Information Retrieval on Flickr30K-Noisy

Cross-Modal Information Retrieval on CC152K

Cross-Modal Information Retrieval on ChEBI-20

Cross-Modal Information Retrieval on Recipe1M

Cross-Modal Information Retrieval on CommercialAdsDataset

Cross-Modal Information Retrieval on ITCPR dataset

Cross-Modal Information Retrieval on MSCOCO-1k

Cross-Modal Information Retrieval on Recipe1M+

Cross-Modal Information Retrieval on SoundingEarth

Cross-Modal Information Retrieval on CUHK-PEDES

Cross-Modal Information Retrieval on Flickr-8k

Cross-Modal Information Retrieval on MS-COCO-2014

Cross-Modal Information Retrieval on MSCOCO

Cross-Modal Information Retrieval on RSICD

Cross-Modal Information Retrieval on RSITMD