Reuters-21578

GraphsCustom (research-only, attribution)

The Reuters-21578 dataset is a collection of documents with news articles. The original corpus has 10,369 documents and a vocabulary of 29,930 words.

Source: Topic Model Based Multi-Label Classification from the Crowd

Benchmarks

Anomaly Detection/AUC (outlier ratio = 0.5)Classification/Accuracy Classification/F1 Classification/Micro-F1 Document Classification/Accuracy Document Classification/F1 Multi-Label Text Classification/Micro-F1 Retrieval/Precision@100 Text Classification/Accuracy Text Classification/F1 Text Classification/Micro-F1 Unsupervised Anomaly Detection/AUC (outlier ratio = 0.5)