TurkCorpus

TextsIntroduced 2016-01-01

TurkCorpus, a dataset with 2,359 original sentences from English Wikipedia, each with 8 manual reference simplifications. The dataset is divided into two subsets: 2,000 sentences for validation and 359 for testing of sentence simplification models.

Benchmarks

Text Simplification/SARI (EASSE>=0.2.1)Text Simplification/BLEU Text Simplification/METEOR Text Simplification/FKGL Text Simplification/QuestEval (Reference-less, BERTScore)