Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

SCI

Self-Contradictory Instructions

ImagesTextsIntroduced 2024-08-02

Large multimodal models (LMMs) excel in adhering to human instructions. However, self-contradictory instructions may arise due to the increasing trend of multimodal interaction and context length, which is challenging for language beginners and vulnerable populations. We introduce the Self-Contradictory Instructions benchmark to evaluate the capability of LMMs in recognizing conflicting commands. It comprises 20,000 conflicts, evenly distributed between language and vision paradigms. It is constructed by a novel automatic dataset creation framework, which expedites the process and enables us to encompass a wide range of instruction forms. Our comprehensive evaluation reveals current LMMs consistently struggle to identify multimodal instruction discordance due to a lack of self-awareness. Hence, we propose the Cognitive Awakening Prompting to inject cognition from external, largely enhancing dissonance detection.

Related Benchmarks

SCICAP/Image Captioning/BLEU-4 SciCite/Classification/F1 SciCite/Classification/Macro-F1 SciCite/Sentence Classification/F1 SciCite/Text Classification/F1 SciCite/Text Classification/Macro-F1 SciDocs/Representation Learning/Avg.SciDocs/Retrieval/nDCG@10 SciDocs (MAG)/Classification/F1 (micro)SciDocs (MAG)/Document Classification/F1 (micro)SciDocs (MAG)/Text Classification/F1 (micro)SciDocs (MeSH)/Classification/F1 (micro)SciDocs (MeSH)/Document Classification/F1 (micro)SciDocs (MeSH)/Text Classification/F1 (micro)SciERC/Continual Pretraining/F1 (macro)SciERC/Few-Shot Learning/F1 (1-Doc)SciERC/Few-Shot Learning/F1 (3-Doc)SciERC/Image Enhancement/F1 score SciERC/Information Extraction/Cross Sentence SciERC/Information Extraction/Entity F1 SciERC/Information Extraction/RE+ Micro F1 SciERC/Information Extraction/Relation F1 SciERC/Meta-Learning/F1 (1-Doc)SciERC/Meta-Learning/F1 (3-Doc)SciERC/Named Entity Recognition (NER)/F1 SciERC/Relation Classification/F1 (1-Doc)SciERC/Relation Classification/F1 (3-Doc)SciERC/Relation Extraction/Cross Sentence SciERC/Relation Extraction/Entity F1 SciERC/Relation Extraction/F1 SciERC/Relation Extraction/F1 (1-Doc)SciERC/Relation Extraction/F1 (3-Doc)SciERC/Relation Extraction/NER Micro F1 SciERC/Relation Extraction/RE+ Micro F1 SciERC/Relation Extraction/Relation F1 SciFact/Retrieval/nDCG@10 SciFact (BEIR)/Fact Checking/nDCG@10 SciQ/Text Generation/Accuracy SciREX/Relation Extraction/Avg. F1 SciTail/Natural Language Inference/% Dev Accuracy SciTail/Natural Language Inference/% Test Accuracy SciTail/Natural Language Inference/Accuracy SciTail/Natural Language Inference/Dev Accuracy ScienceCite/Classification/F1 ScienceCite/Sentence Classification/F1 ScienceCite/Text Classification/F1 ScienceQA/Question Answering/Avg. Accuracy ScienceQA/Question Answering/Grades 1-6 ScienceQA/Question Answering/Grades 7-12 ScienceQA/Question Answering/Image Context ScienceQA/Question Answering/Language Science ScienceQA/Question Answering/Natural Science ScienceQA/Question Answering/No Context ScienceQA/Question Answering/Social Science ScienceQA/Question Answering/Text Context sciERC-sent/Relation Extraction/F1

Statistics

Papers: 1
Benchmarks: 0

Links