MTEB: Massive Text Embedding Benchmark

Niklas Muennighoff, Nouamane Tazi, Loïc Magne, Nils Reimers

2022-10-13Text Classification Reranking Benchmarking Text Summarization Text Retrieval Text Clustering Text Pair Classification Semantic Textual Similarity Information Retrieval Text Reranking STS

Paper PDF Code Code(official)Code Code Code

Abstract

Text embeddings are commonly evaluated on a small set of datasets from a single task not covering their possible applications to other tasks. It is unclear whether state-of-the-art embeddings on semantic textual similarity (STS) can be equally well applied to other tasks like clustering or reranking. This makes progress in the field difficult to track, as various models are constantly being proposed without proper evaluation. To solve this problem, we introduce the Massive Text Embedding Benchmark (MTEB). MTEB spans 8 embedding tasks covering a total of 58 datasets and 112 languages. Through the benchmarking of 33 models on MTEB, we establish the most comprehensive benchmark of text embeddings to date. We find that no particular text embedding method dominates across all tasks. This suggests that the field has yet to converge on a universal text embedding method and scale it up sufficiently to provide state-of-the-art results on all embedding tasks. MTEB comes with open-source code and a public leaderboard at https://github.com/embeddings-benchmark/mteb.

Results

Task	Dataset	Metric	Value	Model
Semantic Textual Similarity	MTEB	Spearman Correlation	82.63	ST5-XXL
Semantic Textual Similarity	MTEB	Spearman Correlation	81.83	ST5-Large
Semantic Textual Similarity	MTEB	Spearman Correlation	81.66	ST5-XL
Semantic Textual Similarity	MTEB	Spearman Correlation	81.14	ST5-Base
Semantic Textual Similarity	MTEB	Spearman Correlation	80.73	MPNet-multilingual
Semantic Textual Similarity	MTEB	Spearman Correlation	80.53	SGPT-5.8B-nli
Semantic Textual Similarity	MTEB	Spearman Correlation	80.28	MPNet
Semantic Textual Similarity	MTEB	Spearman Correlation	79.8	MiniLM-L12
Semantic Textual Similarity	MTEB	Spearman Correlation	79.12	SimCSE-BERT-sup
Semantic Textual Similarity	MTEB	Spearman Correlation	78.92	MiniLM-L6
Semantic Textual Similarity	MTEB	Spearman Correlation	78.6	Ada Similarity
Semantic Textual Similarity	MTEB	Spearman Correlation	78.38	GTR-XXL
Semantic Textual Similarity	MTEB	Spearman Correlation	78.19	GTR-Large
Semantic Textual Similarity	MTEB	Spearman Correlation	78.1	SGPT-5.8B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	77.8	GTR-XL
Semantic Textual Similarity	MTEB	Spearman Correlation	77.74	SGPT-BLOOM-7.1B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	77.07	GTR-Base
Semantic Textual Similarity	MTEB	Spearman Correlation	76.83	SGPT-2.7B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	76.47	coCondenser-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	75.74	SGPT-1.3B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	74.71	SGPT-125M-nli
Semantic Textual Similarity	MTEB	Spearman Correlation	74.33	SimCSE-BERT-unsup
Semantic Textual Similarity	MTEB	Spearman Correlation	73.41	SGPT-125M-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	70.8	LaBSE
Semantic Textual Similarity	MTEB	Spearman Correlation	62.47	Komninos
Semantic Textual Similarity	MTEB	Spearman Correlation	61.85	Glove
Semantic Textual Similarity	MTEB	Spearman Correlation	61.02	SPECTER
Semantic Textual Similarity	MTEB	Spearman Correlation	55.32	LASER2
Semantic Textual Similarity	MTEB	Spearman Correlation	54.36	BERT
Text Clustering	MTEB	V-Measure	43.71	ST5-XXL
Text Clustering	MTEB	V-Measure	43.69	MPNet
Text Clustering	MTEB	V-Measure	42.42	GTR-XXL
Text Clustering	MTEB	V-Measure	42.35	MiniLM-L6
Text Clustering	MTEB	V-Measure	42.34	ST5-XL
Text Clustering	MTEB	V-Measure	41.81	MiniLM-L12
Text Clustering	MTEB	V-Measure	41.65	ST5-Large
Text Clustering	MTEB	V-Measure	41.6	GTR-Large
Text Clustering	MTEB	V-Measure	41.51	GTR-XL
Text Clustering	MTEB	V-Measure	41.1	Contriever
Text Clustering	MTEB	V-Measure	40.35	SGPT-5.8B-msmarco
Text Clustering	MTEB	V-Measure	40.21	ST5-Base
Text Clustering	MTEB	V-Measure	39.92	SGPT-1.3B-msmarco
Text Clustering	MTEB	V-Measure	39.83	SGPT-2.7B-msmarco
Text Clustering	MTEB	V-Measure	38.93	SGPT-BLOOM-7.1B-msmarco
Text Clustering	MTEB	V-Measure	38.63	GTR-Base
Text Clustering	MTEB	V-Measure	38.4	MPNet-multilingual
Text Clustering	MTEB	V-Measure	37.64	coCondenser-msmarco
Text Clustering	MTEB	V-Measure	37.52	Ada Similarity
Text Clustering	MTEB	V-Measure	37.14	MiniLM-L12-multilingual
Text Clustering	MTEB	V-Measure	36.98	SGPT-5.8B-nli
Text Clustering	MTEB	V-Measure	35.79	SGPT-125M-msmarco
Text Clustering	MTEB	V-Measure	34.06	SPECTER
Text Clustering	MTEB	V-Measure	33.43	SimCSE-BERT-sup
Text Clustering	MTEB	V-Measure	30.95	SGPT-125M-nli
Text Clustering	MTEB	V-Measure	30.12	BERT
Text Clustering	MTEB	V-Measure	29.55	LaBSE
Text Clustering	MTEB	V-Measure	29.04	SimCSE-BERT-unsup
Text Clustering	MTEB	V-Measure	27.73	Glove
Text Clustering	MTEB	V-Measure	26.57	Komninos
Text Clustering	MTEB	V-Measure	15.28	LASER2
Text Summarization	MTEB	Spearman Correlation	31.57	MPNet-multilingual
Text Summarization	MTEB	Spearman Correlation	31.39	ST5-Base
Text Summarization	MTEB	Spearman Correlation	31.15	SimCSE-BERT-unsup
Text Summarization	MTEB	Spearman Correlation	30.81	MiniLM-L6
Text Summarization	MTEB	Spearman Correlation	30.67	MiniLM-L12-multilingual
Text Summarization	MTEB	Spearman Correlation	30.64	GTR-XXL
Text Summarization	MTEB	Spearman Correlation	30.49	Komninos
Text Summarization	MTEB	Spearman Correlation	30.36	Contriever
Text Summarization	MTEB	Spearman Correlation	30.26	SGPT-125M-nli
Text Summarization	MTEB	Spearman Correlation	30.21	GTR-XL
Text Summarization	MTEB	Spearman Correlation	30.08	ST5-XXL
Text Summarization	MTEB	Spearman Correlation	29.91	ST5-XL
Text Summarization	MTEB	Spearman Correlation	29.82	BERT
Text Summarization	MTEB	Spearman Correlation	29.67	GTR-Base
Text Summarization	MTEB	Spearman Correlation	29.64	ST5-Large
Text Summarization	MTEB	Spearman Correlation	29.5	coCondenser-msmarco
Text Summarization	MTEB	Spearman Correlation	28.87	Glove
Text Summarization	MTEB	Spearman Correlation	27.9	MiniLM-L12
Text Summarization	MTEB	Spearman Correlation	27.66	SPECTER
Text Summarization	MTEB	Spearman Correlation	27.49	MPNet
Text Summarization	MTEB	Spearman Correlation	26.94	Ada Similarity
Text Summarization	MTEB	Spearman Correlation	26.8	LASER2
Text Summarization	MTEB	Spearman Correlation	25.44	SGPT-1.3B-msmarco
Text Summarization	MTEB	Spearman Correlation	24.99	SGPT-BLOOM-7.1B-msmarco
Text Summarization	MTEB	Spearman Correlation	24.75	SGPT-5.8B-msmarco
Text Summarization	MTEB	Spearman Correlation	23.31	SimCSE-BERT-sup
Text Classification	MTEB	Accuracy	73.42	ST5-XXL
Text Classification	MTEB	Accuracy	72.84	ST5-XL
Text Classification	MTEB	Accuracy	72.31	ST5-Large
Text Classification	MTEB	Accuracy	70.44	Ada Similarity
Text Classification	MTEB	Accuracy	70.14	SGPT-5.8B-nli
Text Classification	MTEB	Accuracy	69.81	ST5-Base
Text Classification	MTEB	Accuracy	68.13	SGPT-5.8B-msmarco
Text Classification	MTEB	Accuracy	67.91	MPNet-multilingual
Text Classification	MTEB	Accuracy	67.41	GTR-XXL
Text Classification	MTEB	Accuracy	67.32	SimCSE-BERT-sup
Text Classification	MTEB	Accuracy	67.14	GTR-Large
Text Classification	MTEB	Accuracy	67.13	SGPT-2.7B-msmarco
Text Classification	MTEB	Accuracy	67.11	GTR-XL
Text Classification	MTEB	Accuracy	66.68	Contriever
Text Classification	MTEB	Accuracy	66.52	SGPT-1.3B-msmarco
Text Classification	MTEB	Accuracy	66.19	SGPT-BLOOM-7.1B-msmarco
Text Classification	MTEB	Accuracy	65.25	GTR-Base
Text Classification	MTEB	Accuracy	65.07	MPNet
Text Classification	MTEB	Accuracy	64.71	coCondenser-msmarco
Text Classification	MTEB	Accuracy	64.3	MiniLM-L12-multilingual
Text Classification	MTEB	Accuracy	63.21	MiniLM-L12
Text Classification	MTEB	Accuracy	63.06	MiniLM-L6
Text Classification	MTEB	Accuracy	62.71	LaBSE
Text Classification	MTEB	Accuracy	62.5	SimCSE-BERT-unsup
Text Classification	MTEB	Accuracy	61.66	BERT
Text Classification	MTEB	Accuracy	61.46	SGPT-125M-nli
Text Classification	MTEB	Accuracy	60.72	SGPT-125M-msmarco
Text Classification	MTEB	Accuracy	57.65	Komninos
Text Classification	MTEB	Accuracy	57.29	Glove
Text Classification	MTEB	Accuracy	53.65	LASER2
Text Classification	MTEB	Accuracy	52.37	SPECTER
Information Retrieval	MTEB	nDCG@10	50.25	SGPT-5.8B-msmarco
Retrieval	MTEB	nDCG@10	50.25	SGPT-5.8B-msmarco
Retrieval	MTEB	nDCG@10	48.48	GTR-XXL
Retrieval	MTEB	nDCG@10	48.21	SGPT-BLOOM-7.1B-msmarco
Retrieval	MTEB	nDCG@10	47.96	GTR-XL
Retrieval	MTEB	nDCG@10	47.42	GTR-Large
Retrieval	MTEB	nDCG@10	46.54	SGPT-2.7B-msmarco
Retrieval	MTEB	nDCG@10	44.67	GTR-Base
Retrieval	MTEB	nDCG@10	44.49	SGPT-1.3B-msmarco
Retrieval	MTEB	nDCG@10	43.81	MPNet
Retrieval	MTEB	nDCG@10	42.69	MiniLM-L12
Retrieval	MTEB	nDCG@10	42.24	ST5-XXL
Retrieval	MTEB	nDCG@10	41.95	MiniLM-L6
Retrieval	MTEB	nDCG@10	41.88	Contriever
Retrieval	MTEB	nDCG@10	38.47	ST5-XL
Retrieval	MTEB	nDCG@10	37.04	SGPT-125M-msmarco
Retrieval	MTEB	nDCG@10	36.71	ST5-Large
Retrieval	MTEB	nDCG@10	35.34	MPNet-multilingual
Retrieval	MTEB	nDCG@10	33.63	ST5-Base
Retrieval	MTEB	nDCG@10	32.96	coCondenser-msmarco
Retrieval	MTEB	nDCG@10	32.45	MiniLM-L12-multilingual
Retrieval	MTEB	nDCG@10	32.34	SGPT-5.8B-nli
Retrieval	MTEB	nDCG@10	21.82	SimCSE-BERT-sup
Retrieval	MTEB	nDCG@10	21.62	Glove
Retrieval	MTEB	nDCG@10	21.22	Komninos
Retrieval	MTEB	nDCG@10	20.9	SGPT-125M-nli
Retrieval	MTEB	nDCG@10	20.29	SimCSE-BERT-unsup
Retrieval	MTEB	nDCG@10	18.99	LaBSE
Retrieval	MTEB	nDCG@10	15.88	SPECTER
Retrieval	MTEB	nDCG@10	10.59	BERT
Retrieval	MTEB	nDCG@10	7.93	LASER2
Classification	MTEB	Accuracy	73.42	ST5-XXL
Classification	MTEB	Accuracy	72.84	ST5-XL
Classification	MTEB	Accuracy	72.31	ST5-Large
Classification	MTEB	Accuracy	70.44	Ada Similarity
Classification	MTEB	Accuracy	70.14	SGPT-5.8B-nli
Classification	MTEB	Accuracy	69.81	ST5-Base
Classification	MTEB	Accuracy	68.13	SGPT-5.8B-msmarco
Classification	MTEB	Accuracy	67.91	MPNet-multilingual
Classification	MTEB	Accuracy	67.41	GTR-XXL
Classification	MTEB	Accuracy	67.32	SimCSE-BERT-sup
Classification	MTEB	Accuracy	67.14	GTR-Large
Classification	MTEB	Accuracy	67.13	SGPT-2.7B-msmarco
Classification	MTEB	Accuracy	67.11	GTR-XL
Classification	MTEB	Accuracy	66.68	Contriever
Classification	MTEB	Accuracy	66.52	SGPT-1.3B-msmarco
Classification	MTEB	Accuracy	66.19	SGPT-BLOOM-7.1B-msmarco
Classification	MTEB	Accuracy	65.25	GTR-Base
Classification	MTEB	Accuracy	65.07	MPNet
Classification	MTEB	Accuracy	64.71	coCondenser-msmarco
Classification	MTEB	Accuracy	64.3	MiniLM-L12-multilingual
Classification	MTEB	Accuracy	63.21	MiniLM-L12
Classification	MTEB	Accuracy	63.06	MiniLM-L6
Classification	MTEB	Accuracy	62.71	LaBSE
Classification	MTEB	Accuracy	62.5	SimCSE-BERT-unsup
Classification	MTEB	Accuracy	61.66	BERT
Classification	MTEB	Accuracy	61.46	SGPT-125M-nli
Classification	MTEB	Accuracy	60.72	SGPT-125M-msmarco
Classification	MTEB	Accuracy	57.65	Komninos
Classification	MTEB	Accuracy	57.29	Glove
Classification	MTEB	Accuracy	53.65	LASER2
Classification	MTEB	Accuracy	52.37	SPECTER

Abstract

Results

Task	Dataset	Metric	Value	Model
Semantic Textual Similarity	MTEB	Spearman Correlation	82.63	ST5-XXL
Semantic Textual Similarity	MTEB	Spearman Correlation	81.83	ST5-Large
Semantic Textual Similarity	MTEB	Spearman Correlation	81.66	ST5-XL
Semantic Textual Similarity	MTEB	Spearman Correlation	81.14	ST5-Base
Semantic Textual Similarity	MTEB	Spearman Correlation	80.73	MPNet-multilingual
Semantic Textual Similarity	MTEB	Spearman Correlation	80.53	SGPT-5.8B-nli
Semantic Textual Similarity	MTEB	Spearman Correlation	80.28	MPNet
Semantic Textual Similarity	MTEB	Spearman Correlation	79.8	MiniLM-L12
Semantic Textual Similarity	MTEB	Spearman Correlation	79.12	SimCSE-BERT-sup
Semantic Textual Similarity	MTEB	Spearman Correlation	78.92	MiniLM-L6
Semantic Textual Similarity	MTEB	Spearman Correlation	78.6	Ada Similarity
Semantic Textual Similarity	MTEB	Spearman Correlation	78.38	GTR-XXL
Semantic Textual Similarity	MTEB	Spearman Correlation	78.19	GTR-Large
Semantic Textual Similarity	MTEB	Spearman Correlation	78.1	SGPT-5.8B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	77.8	GTR-XL
Semantic Textual Similarity	MTEB	Spearman Correlation	77.74	SGPT-BLOOM-7.1B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	77.07	GTR-Base
Semantic Textual Similarity	MTEB	Spearman Correlation	76.83	SGPT-2.7B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	76.47	coCondenser-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	75.74	SGPT-1.3B-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	74.71	SGPT-125M-nli
Semantic Textual Similarity	MTEB	Spearman Correlation	74.33	SimCSE-BERT-unsup
Semantic Textual Similarity	MTEB	Spearman Correlation	73.41	SGPT-125M-msmarco
Semantic Textual Similarity	MTEB	Spearman Correlation	70.8	LaBSE
Semantic Textual Similarity	MTEB	Spearman Correlation	62.47	Komninos
Semantic Textual Similarity	MTEB	Spearman Correlation	61.85	Glove
Semantic Textual Similarity	MTEB	Spearman Correlation	61.02	SPECTER
Semantic Textual Similarity	MTEB	Spearman Correlation	55.32	LASER2
Semantic Textual Similarity	MTEB	Spearman Correlation	54.36	BERT
Text Clustering	MTEB	V-Measure	43.71	ST5-XXL
Text Clustering	MTEB	V-Measure	43.69	MPNet
Text Clustering	MTEB	V-Measure	42.42	GTR-XXL
Text Clustering	MTEB	V-Measure	42.35	MiniLM-L6
Text Clustering	MTEB	V-Measure	42.34	ST5-XL
Text Clustering	MTEB	V-Measure	41.81	MiniLM-L12
Text Clustering	MTEB	V-Measure	41.65	ST5-Large
Text Clustering	MTEB	V-Measure	41.6	GTR-Large
Text Clustering	MTEB	V-Measure	41.51	GTR-XL
Text Clustering	MTEB	V-Measure	41.1	Contriever
Text Clustering	MTEB	V-Measure	40.35	SGPT-5.8B-msmarco
Text Clustering	MTEB	V-Measure	40.21	ST5-Base
Text Clustering	MTEB	V-Measure	39.92	SGPT-1.3B-msmarco
Text Clustering	MTEB	V-Measure	39.83	SGPT-2.7B-msmarco
Text Clustering	MTEB	V-Measure	38.93	SGPT-BLOOM-7.1B-msmarco
Text Clustering	MTEB	V-Measure	38.63	GTR-Base
Text Clustering	MTEB	V-Measure	38.4	MPNet-multilingual
Text Clustering	MTEB	V-Measure	37.64	coCondenser-msmarco
Text Clustering	MTEB	V-Measure	37.52	Ada Similarity
Text Clustering	MTEB	V-Measure	37.14	MiniLM-L12-multilingual
Text Clustering	MTEB	V-Measure	36.98	SGPT-5.8B-nli
Text Clustering	MTEB	V-Measure	35.79	SGPT-125M-msmarco
Text Clustering	MTEB	V-Measure	34.06	SPECTER
Text Clustering	MTEB	V-Measure	33.43	SimCSE-BERT-sup
Text Clustering	MTEB	V-Measure	30.95	SGPT-125M-nli
Text Clustering	MTEB	V-Measure	30.12	BERT
Text Clustering	MTEB	V-Measure	29.55	LaBSE
Text Clustering	MTEB	V-Measure	29.04	SimCSE-BERT-unsup
Text Clustering	MTEB	V-Measure	27.73	Glove
Text Clustering	MTEB	V-Measure	26.57	Komninos
Text Clustering	MTEB	V-Measure	15.28	LASER2
Text Summarization	MTEB	Spearman Correlation	31.57	MPNet-multilingual
Text Summarization	MTEB	Spearman Correlation	31.39	ST5-Base
Text Summarization	MTEB	Spearman Correlation	31.15	SimCSE-BERT-unsup
Text Summarization	MTEB	Spearman Correlation	30.81	MiniLM-L6
Text Summarization	MTEB	Spearman Correlation	30.67	MiniLM-L12-multilingual
Text Summarization	MTEB	Spearman Correlation	30.64	GTR-XXL
Text Summarization	MTEB	Spearman Correlation	30.49	Komninos
Text Summarization	MTEB	Spearman Correlation	30.36	Contriever
Text Summarization	MTEB	Spearman Correlation	30.26	SGPT-125M-nli
Text Summarization	MTEB	Spearman Correlation	30.21	GTR-XL
Text Summarization	MTEB	Spearman Correlation	30.08	ST5-XXL
Text Summarization	MTEB	Spearman Correlation	29.91	ST5-XL
Text Summarization	MTEB	Spearman Correlation	29.82	BERT
Text Summarization	MTEB	Spearman Correlation	29.67	GTR-Base
Text Summarization	MTEB	Spearman Correlation	29.64	ST5-Large
Text Summarization	MTEB	Spearman Correlation	29.5	coCondenser-msmarco
Text Summarization	MTEB	Spearman Correlation	28.87	Glove
Text Summarization	MTEB	Spearman Correlation	27.9	MiniLM-L12
Text Summarization	MTEB	Spearman Correlation	27.66	SPECTER
Text Summarization	MTEB	Spearman Correlation	27.49	MPNet
Text Summarization	MTEB	Spearman Correlation	26.94	Ada Similarity
Text Summarization	MTEB	Spearman Correlation	26.8	LASER2
Text Summarization	MTEB	Spearman Correlation	25.44	SGPT-1.3B-msmarco
Text Summarization	MTEB	Spearman Correlation	24.99	SGPT-BLOOM-7.1B-msmarco
Text Summarization	MTEB	Spearman Correlation	24.75	SGPT-5.8B-msmarco
Text Summarization	MTEB	Spearman Correlation	23.31	SimCSE-BERT-sup
Text Classification	MTEB	Accuracy	73.42	ST5-XXL
Text Classification	MTEB	Accuracy	72.84	ST5-XL
Text Classification	MTEB	Accuracy	72.31	ST5-Large
Text Classification	MTEB	Accuracy	70.44	Ada Similarity
Text Classification	MTEB	Accuracy	70.14	SGPT-5.8B-nli
Text Classification	MTEB	Accuracy	69.81	ST5-Base
Text Classification	MTEB	Accuracy	68.13	SGPT-5.8B-msmarco
Text Classification	MTEB	Accuracy	67.91	MPNet-multilingual
Text Classification	MTEB	Accuracy	67.41	GTR-XXL
Text Classification	MTEB	Accuracy	67.32	SimCSE-BERT-sup
Text Classification	MTEB	Accuracy	67.14	GTR-Large
Text Classification	MTEB	Accuracy	67.13	SGPT-2.7B-msmarco
Text Classification	MTEB	Accuracy	67.11	GTR-XL
Text Classification	MTEB	Accuracy	66.68	Contriever
Text Classification	MTEB	Accuracy	66.52	SGPT-1.3B-msmarco
Text Classification	MTEB	Accuracy	66.19	SGPT-BLOOM-7.1B-msmarco
Text Classification	MTEB	Accuracy	65.25	GTR-Base
Text Classification	MTEB	Accuracy	65.07	MPNet
Text Classification	MTEB	Accuracy	64.71	coCondenser-msmarco
Text Classification	MTEB	Accuracy	64.3	MiniLM-L12-multilingual
Text Classification	MTEB	Accuracy	63.21	MiniLM-L12
Text Classification	MTEB	Accuracy	63.06	MiniLM-L6
Text Classification	MTEB	Accuracy	62.71	LaBSE
Text Classification	MTEB	Accuracy	62.5	SimCSE-BERT-unsup
Text Classification	MTEB	Accuracy	61.66	BERT
Text Classification	MTEB	Accuracy	61.46	SGPT-125M-nli
Text Classification	MTEB	Accuracy	60.72	SGPT-125M-msmarco
Text Classification	MTEB	Accuracy	57.65	Komninos
Text Classification	MTEB	Accuracy	57.29	Glove
Text Classification	MTEB	Accuracy	53.65	LASER2
Text Classification	MTEB	Accuracy	52.37	SPECTER
Information Retrieval	MTEB	nDCG@10	50.25	SGPT-5.8B-msmarco
Retrieval	MTEB	nDCG@10	50.25	SGPT-5.8B-msmarco
Retrieval	MTEB	nDCG@10	48.48	GTR-XXL
Retrieval	MTEB	nDCG@10	48.21	SGPT-BLOOM-7.1B-msmarco
Retrieval	MTEB	nDCG@10	47.96	GTR-XL
Retrieval	MTEB	nDCG@10	47.42	GTR-Large
Retrieval	MTEB	nDCG@10	46.54	SGPT-2.7B-msmarco
Retrieval	MTEB	nDCG@10	44.67	GTR-Base
Retrieval	MTEB	nDCG@10	44.49	SGPT-1.3B-msmarco
Retrieval	MTEB	nDCG@10	43.81	MPNet
Retrieval	MTEB	nDCG@10	42.69	MiniLM-L12
Retrieval	MTEB	nDCG@10	42.24	ST5-XXL
Retrieval	MTEB	nDCG@10	41.95	MiniLM-L6
Retrieval	MTEB	nDCG@10	41.88	Contriever
Retrieval	MTEB	nDCG@10	38.47	ST5-XL
Retrieval	MTEB	nDCG@10	37.04	SGPT-125M-msmarco
Retrieval	MTEB	nDCG@10	36.71	ST5-Large
Retrieval	MTEB	nDCG@10	35.34	MPNet-multilingual
Retrieval	MTEB	nDCG@10	33.63	ST5-Base
Retrieval	MTEB	nDCG@10	32.96	coCondenser-msmarco
Retrieval	MTEB	nDCG@10	32.45	MiniLM-L12-multilingual
Retrieval	MTEB	nDCG@10	32.34	SGPT-5.8B-nli
Retrieval	MTEB	nDCG@10	21.82	SimCSE-BERT-sup
Retrieval	MTEB	nDCG@10	21.62	Glove
Retrieval	MTEB	nDCG@10	21.22	Komninos
Retrieval	MTEB	nDCG@10	20.9	SGPT-125M-nli
Retrieval	MTEB	nDCG@10	20.29	SimCSE-BERT-unsup
Retrieval	MTEB	nDCG@10	18.99	LaBSE
Retrieval	MTEB	nDCG@10	15.88	SPECTER
Retrieval	MTEB	nDCG@10	10.59	BERT
Retrieval	MTEB	nDCG@10	7.93	LASER2
Classification	MTEB	Accuracy	73.42	ST5-XXL
Classification	MTEB	Accuracy	72.84	ST5-XL
Classification	MTEB	Accuracy	72.31	ST5-Large
Classification	MTEB	Accuracy	70.44	Ada Similarity
Classification	MTEB	Accuracy	70.14	SGPT-5.8B-nli
Classification	MTEB	Accuracy	69.81	ST5-Base
Classification	MTEB	Accuracy	68.13	SGPT-5.8B-msmarco
Classification	MTEB	Accuracy	67.91	MPNet-multilingual
Classification	MTEB	Accuracy	67.41	GTR-XXL
Classification	MTEB	Accuracy	67.32	SimCSE-BERT-sup
Classification	MTEB	Accuracy	67.14	GTR-Large
Classification	MTEB	Accuracy	67.13	SGPT-2.7B-msmarco
Classification	MTEB	Accuracy	67.11	GTR-XL
Classification	MTEB	Accuracy	66.68	Contriever
Classification	MTEB	Accuracy	66.52	SGPT-1.3B-msmarco
Classification	MTEB	Accuracy	66.19	SGPT-BLOOM-7.1B-msmarco
Classification	MTEB	Accuracy	65.25	GTR-Base
Classification	MTEB	Accuracy	65.07	MPNet
Classification	MTEB	Accuracy	64.71	coCondenser-msmarco
Classification	MTEB	Accuracy	64.3	MiniLM-L12-multilingual
Classification	MTEB	Accuracy	63.21	MiniLM-L12
Classification	MTEB	Accuracy	63.06	MiniLM-L6
Classification	MTEB	Accuracy	62.71	LaBSE
Classification	MTEB	Accuracy	62.5	SimCSE-BERT-unsup
Classification	MTEB	Accuracy	61.66	BERT
Classification	MTEB	Accuracy	61.46	SGPT-125M-nli
Classification	MTEB	Accuracy	60.72	SGPT-125M-msmarco
Classification	MTEB	Accuracy	57.65	Komninos
Classification	MTEB	Accuracy	57.29	Glove
Classification	MTEB	Accuracy	53.65	LASER2
Classification	MTEB	Accuracy	52.37	SPECTER

MTEB: Massive Text Embedding Benchmark

Abstract

Results

Related Papers

MTEB: Massive Text Embedding Benchmark

Abstract

Results

Related Papers