MultiFiT: Efficient Multi-lingual Language Model Fine-tuning

Julian Martin Eisenschlos, Sebastian Ruder, Piotr Czapla, Marcin Kardas, Sylvain Gugger, Jeremy Howard

2019-09-10IJCNLP 2019 11Cross-Lingual Document Classification Document Classification Language Modelling

Abstract

Pretrained language models are promising particularly for low-resource languages as they only require unlabelled data. However, training existing models requires huge amounts of compute, while pretrained cross-lingual models often underperform on low-resource languages. We propose Multi-lingual language model Fine-Tuning (MultiFiT) to enable practitioners to train and fine-tune language models efficiently in their own language. In addition, we propose a zero-shot method using an existing pretrained cross-lingual model. We evaluate our methods on two widely used cross-lingual classification datasets where they outperform models pretrained on orders of magnitude more data and compute. We release all models and code.

Results

Task	Dataset	Metric	Value	Model
Cross-Lingual	MLDoc Zero-Shot English-to-Japanese	Accuracy	69.57	MultiFiT, pseudo
Cross-Lingual	MLDoc Zero-Shot English-to-French	Accuracy	89.42	MultiFiT, pseudo
Cross-Lingual	MLDoc Zero-Shot English-to-Chinese	Accuracy	82.48	MultiFiT, pseudo
Cross-Lingual	MLDoc Zero-Shot English-to-Spanish	Accuracy	79.1	MultiFiT, pseudo
Cross-Lingual	MLDoc Zero-Shot English-to-Russian	Accuracy	67.83	MultiFiT, pseudo
Cross-Lingual	MLDoc Zero-Shot English-to-Italian	Accuracy	76.02	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-Japanese	Accuracy	69.57	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-French	Accuracy	89.42	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-Chinese	Accuracy	82.48	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-Spanish	Accuracy	79.1	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-Russian	Accuracy	67.83	MultiFiT, pseudo
Cross-Lingual Document Classification	MLDoc Zero-Shot English-to-Italian	Accuracy	76.02	MultiFiT, pseudo

MultiFiT: Efficient Multi-lingual Language Model Fine-tuning

Abstract

Results

Related Papers

MultiFiT: Efficient Multi-lingual Language Model Fine-tuning

Abstract

Results

Related Papers