Mathematical Proofs on miniF2F-test

Metric: Pass@32 (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Hide extra data

Sort:

#	Model↕	Pass@32▼	Extra Data	Paper	Date↕	Code
1	Kimina-Prover-Preview	68.85	Yes	Kimina-Prover Preview: Towards Large Formal Reas...	2025-04-15	Code
2	DeepSeek-Prover-V1.5	50	Yes	DeepSeek-Prover-V1.5: Harnessing Proof Assistant...	2024-08-15	Code
3	Subgoal-XL	39.3	Yes	SubgoalXL: Subgoal-based Expert Learning for The...	2024-08-20	Code
4	Lean Expert Iteration	34.5	Yes	Formal Mathematics Statement Curriculum Learning	2022-02-03	Code
5	Lean GPT-f	29.2	No	MiniF2F: a cross-system benchmark for formal Oly...	2021-08-31	Code
6	ReProver	26.5	No	-	-	-
7	LLEMMA-7b	26.2	No	Llemma: An Open Language Model For Mathematics	2023-10-16	Code
8	LLEMMA-34b	25.8	No	Llemma: An Open Language Model For Mathematics	2023-10-16	Code

#1Kimina-Prover-PreviewSOTA
68.85
Pass@32· Extra Data· 2025-04-15
Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning Code
#2DeepSeek-Prover-V1.5SOTA
50
Pass@32· Extra Data· 2024-08-15
DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search Code
#3Subgoal-XL
39.3
Pass@32· Extra Data· 2024-08-20
SubgoalXL: Subgoal-based Expert Learning for Theorem Proving Code
#4Lean Expert IterationSOTA
34.5
Pass@32· Extra Data· 2022-02-03
Formal Mathematics Statement Curriculum Learning Code
#5Lean GPT-fSOTA
29.2
Pass@32· 2021-08-31
MiniF2F: a cross-system benchmark for formal Olympiad-level mathematics Code
#6ReProver
26.5
Pass@32
No paper
#7LLEMMA-7b
26.2
Pass@32· 2023-10-16
Llemma: An Open Language Model For Mathematics Code
#8LLEMMA-34b
25.8
Pass@32· 2023-10-16
Llemma: An Open Language Model For Mathematics Code