ESP

Evaluation for Styled Prompt

ImagesTextsIntroduced 2023-06-06

ESP dataset (Evaluation for Styled Prompt dataset) is a benchmark for zero-shot domain-conditional caption generation. ESP is a new dataset focusing on providing multiple styled text targets for the same image. It comprises 4.8k captions from 1k images in the COCO Captions test set. We collect five text domains with everyday usage: blog, social media, instruction, story, and news.

Related Benchmarks

ESPL/Full reference image quality assessment/PLCC ESPL/Full reference image quality assessment/SRCC ESPL/Image Quality Assessment/PLCC ESPL/Image Quality Assessment/SRCC eSports Sensors Dataset/Person Re-Identification/Accuracy eSports Sensors Dataset/Person Re-Identification/LogLoss eSports Sensors Dataset/Person Re-Identification/ROC AUC eSports Sensors Dataset/Skills Evaluation/Accuracy eSports Sensors Dataset/Skills Evaluation/LogLoss eSports Sensors Dataset/Skills Evaluation/ROC AUC