Flickr30k

ImagesTextsCustom (research-only, non-commercial)Introduced 2014-01-01

The Flickr30k dataset contains 31,000 images collected from Flickr, together with 5 reference sentences provided by human annotators.

Source: Guiding Long-Short Term Memory for Image Caption Generation

Image Source: Dual-Path Convolutional Image-Text Embedding with Instance Loss

Benchmarks

Related Benchmarks

Flickr30K 1K test/Image Retrieval/R@1 Flickr30K 1K test/Image Retrieval/R@10 Flickr30K 1K test/Image Retrieval/R@5 Flickr30K-Noisy/Cross-Modal Information Retrieval/Image-to-text R@1 Flickr30K-Noisy/Cross-Modal Information Retrieval/Image-to-text R@10 Flickr30K-Noisy/Cross-Modal Information Retrieval/Image-to-text R@5 Flickr30K-Noisy/Cross-Modal Information Retrieval/R-Sum Flickr30K-Noisy/Cross-Modal Information Retrieval/Text-to-image R@1 Flickr30K-Noisy/Cross-Modal Information Retrieval/Text-to-image R@10 Flickr30K-Noisy/Cross-Modal Information Retrieval/Text-to-image R@5 Flickr30K-Noisy/Cross-Modal Retrieval/Image-to-text R@1 Flickr30K-Noisy/Cross-Modal Retrieval/Image-to-text R@10 Flickr30K-Noisy/Cross-Modal Retrieval/Image-to-text R@5 Flickr30K-Noisy/Cross-Modal Retrieval/R-Sum Flickr30K-Noisy/Cross-Modal Retrieval/Text-to-image R@1 Flickr30K-Noisy/Cross-Modal Retrieval/Text-to-image R@10 Flickr30K-Noisy/Cross-Modal Retrieval/Text-to-image R@5 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Image-to-text R@1 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Image-to-text R@10 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Image-to-text R@5 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/R-Sum Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Text-to-image R@1 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Text-to-image R@10 Flickr30K-Noisy/Image Retrieval with Multi-Modal Query/Text-to-image R@5 Flickr30k Captions test/Image Captioning/BLEU-4 Flickr30k Captions test/Image Captioning/CIDEr Flickr30k Captions test/Image Captioning/METEOR Flickr30k Captions test/Image Captioning/SPICE Flickr30k Entities Dev/Phrase Grounding/R@1 Flickr30k Entities Dev/Phrase Grounding/R@10 Flickr30k Entities Dev/Phrase Grounding/R@5 Flickr30k Entities Test/Phrase Grounding/R@1 Flickr30k Entities Test/Phrase Grounding/R@10 Flickr30k Entities Test/Phrase Grounding/R@5 Flickr30k-CN/Image Retrieval/R@1 Flickr30k-CN/Image Retrieval/R@10 Flickr30k-CN/Image Retrieval/R@5