Bag of Tricks for Efficient Text Classification

Armand Joulin, Edouard Grave, Piotr Bojanowski, Tomas Mikolov

2016-07-06EACL 2017 4Text Classification Emotion Recognition in Conversation Sentiment Analysis General Classification

Abstract

This paper explores a simple and efficient baseline for text classification. Our experiments show that our fast text classifier fastText is often on par with deep learning classifiers in terms of accuracy, and many orders of magnitude faster for training and evaluation. We can train fastText on more than one billion words in less than ten minutes using a standard multicore~CPU, and classify half a million sentences among~312K classes in less than a minute.

Results

Task	Dataset	Metric	Value	Model
Emotion Recognition	CPED	Accuracy of Sentiment	48.62	FastText
Emotion Recognition	CPED	Macro-F1 of Sentiment	30.33	FastText
Sentiment Analysis	Sogou News	Accuracy	96.8	fastText, h=10, bigram
Sentiment Analysis	Amazon Review Polarity	Accuracy	94.6	FastText
Sentiment Analysis	Yelp Fine-grained classification	Error	36.1	FastText
Sentiment Analysis	Yelp Binary classification	Error	4.3	fastText, h=10, bigram
Sentiment Analysis	Amazon Review Full	Accuracy	60.2	FastText
Text Classification	DBpedia	Error	1.4	FastText
Text Classification	AG News	Error	7.5	fastText
Text Classification	Yahoo! Answers	Accuracy	72.3	FastText
Classification	DBpedia	Error	1.4	FastText
Classification	AG News	Error	7.5	fastText
Classification	Yahoo! Answers	Accuracy	72.3	FastText

Related Papers

Long-Short Distance Graph Neural Networks and Improved Curriculum Learning for Emotion Recognition in Conversation2025-07-21 Making Language Model a Hierarchical Classifier and Generator2025-07-17 AdaptiSent: Context-Aware Adaptive Attention for Multimodal Aspect-Based Sentiment Analysis2025-07-17 AI Wizards at CheckThat! 2025: Enhancing Transformer-Based Embeddings with Sentiment for Subjectivity Detection in News Articles2025-07-15 DCR: Quantifying Data Contamination in LLMs Evaluation2025-07-15 SentiDrop: A Multi Modal Machine Learning model for Predicting Dropout in Distance Learning2025-07-14 Dynamic Parameter Memory: Temporary LoRA-Enhanced LLM for Long-Sequence Emotion Recognition in Conversation2025-07-11 GNN-CNN: An Efficient Hybrid Model of Convolutional and Graph Neural Networks for Text Representation2025-07-10