MED

Monotonicity Entailment Dataset

Texts

MED is a new evaluation dataset that covers a wide range of monotonicity reasoning that was created by crowdsourcing and collected from linguistics publications. The dataset was constructed by collecting naturally-occurring examples by crowdsourcing and well-designed ones from linguistics publications. It consists of 5,382 examples.

Source: https://github.com/verypluming/MED Image Source: https://www.aclweb.org/anthology/W19-4804v2.pdf

Benchmarks

Natural Language Inference/1:1 Accuracy

Related Benchmarks

MedConceptsQA/Few-Shot Learning/Accuracy MedConceptsQA/Meta-Learning/Accuracy MedConceptsQA/Zero-Shot Learning/Accuracy MedMCQA/Question Answering/Dev Set (Acc-%)MedMCQA/Question Answering/Test Set (Acc-%)MedMCQA Dev/Question Answering/Accuarcy MedMentions/Entity Linking/Accuracy MedMentions/Entity Linking/Recall@64 MedNLI/Few-Shot Learning/Accuracy MedNLI/Meta-Learning/Accuracy MedNLI/Natural Language Inference/Accuracy MedNLI/Natural Language Inference/Params (M)MedQA/Question Answering/Accuracy MedSTS/Language Modelling/Pearson Correlation MedSTS/Representation Learning/Pearson Correlation MedSTS/Semantic Similarity/Pearson Correlation MedSTS/Sentence Embeddings/Pearson Correlation MedSTS/Sentence Pair Modeling/Pearson Correlation MedSecId/Classification/1 shot Micro-F1 MedTurkQuAD: Medical Turkish Question-Answering Dataset/Question Answering/Exact Match MedTurkQuAD: Medical Turkish Question-Answering Dataset/Question Answering/F1 Score MediBeng/Speech-to-Text Translation/Bleu MediaEval2016/Fake News Detection/Accuracy MediaSpeech/Speech Recognition/WER for Arabic MediaSpeech/Speech Recognition/WER for French MediaSpeech/Speech Recognition/WER for Spanish MediaSpeech/Speech Recognition/WER for Turkish MediaSum/Text Summarization/ROUGE-1 Mediapi-RGB/Sign Language Translation/BLEU-4 Medical Abstracts/Classification/F1-score Medical Abstracts/Text Classification/F1-score Medical Cost Personal Dataset/regression/R2 Score Medical Cost Personal Dataset/regression/lambda Medical Segmentation Decathlon/Medical Image Segmentation/Dice (Average)Medical Segmentation Decathlon/Medical Image Segmentation/NSD Medical domain/Hypernym Discovery/MAP Medical domain/Hypernym Discovery/MRR Medical domain/Hypernym Discovery/P@5 Medical domain/Taxonomy Learning/MAP Medical domain/Taxonomy Learning/MRR Medical domain/Taxonomy Learning/P@5 Medico automatic polyp segmentation challenge (dataset)/Medical Image Segmentation/DSC Medico automatic polyp segmentation challenge (dataset)/Medical Image Segmentation/FPS Medico automatic polyp segmentation challenge (dataset)/Medical Image Segmentation/Precision Medico automatic polyp segmentation challenge (dataset)/Medical Image Segmentation/Recall Medico automatic polyp segmentation challenge (dataset)/Medical Image Segmentation/mIoU