HyperTree Proof Search for Neural Theorem Proving

Guillaume Lample, Marie-Anne Lachaux, Thibaut Lavril, Xavier Martinet, Amaury Hayat, Gabriel Ebner, Aurélien Rodriguez, Timothée Lacroix

2022-05-23Automated Theorem Proving

Paper PDF

Abstract

We propose an online training procedure for a transformer-based automated theorem prover. Our approach leverages a new search algorithm, HyperTree Proof Search (HTPS), inspired by the recent success of AlphaZero. Our model learns from previous proof searches through online training, allowing it to generalize to domains far from the training distribution. We report detailed ablations of our pipeline's main components by studying performance on three environments of increasing complexity. In particular, we show that with HTPS alone, a model trained on annotated proofs manages to prove 65.4% of a held-out set of Metamath theorems, significantly outperforming the previous state of the art of 56.5% by GPT-f. Online training on these unproved theorems increases accuracy to 82.6%. With a similar computational budget, we improve the state of the art on the Lean-based miniF2F-curriculum dataset from 31% to 42% proving accuracy.

Results

Task	Dataset	Metric	Value	Model
Automated Theorem Proving	Metamath set.mm	Pass@32	72.4	Evariste
Automated Theorem Proving	miniF2F-valid	Pass@64	58.6	Evariste
Automated Theorem Proving	miniF2F-valid	Pass@64	47.5	Evariste-7d
Automated Theorem Proving	miniF2F-valid	Pass@64	47.3	GPT-f
Automated Theorem Proving	miniF2F-valid	Pass@64	46.7	Evariste-1d
Automated Theorem Proving	miniF2F-curriculum	Pass@64	42.5	Evariste-7d
Automated Theorem Proving	miniF2F-curriculum	Pass@64	33.6	Evariste-1d
Automated Theorem Proving	miniF2F-curriculum	Pass@64	32.1	Evariste
Automated Theorem Proving	miniF2F-curriculum	Pass@64	30.6	GPT-f
Automated Theorem Proving	miniF2F-test	Pass@64	41	Evariste
Automated Theorem Proving	miniF2F-test	cumulative	41	Evariste
Automated Theorem Proving	miniF2F-test	Pass@64	40.6	Evariste-7d
Automated Theorem Proving	miniF2F-test	cumulative	40.6	Evariste-7d
Automated Theorem Proving	miniF2F-test	Pass@64	38.9	Evariste-1d
Automated Theorem Proving	miniF2F-test	cumulative	38.9	Evariste-1d
Automated Theorem Proving	miniF2F-test	Pass@64	36.6	GPT-f
Automated Theorem Proving	miniF2F-test	cumulative	36.6	GPT-f
Mathematical Proofs	Metamath set.mm	Pass@32	72.4	Evariste
Mathematical Proofs	miniF2F-valid	Pass@64	58.6	Evariste
Mathematical Proofs	miniF2F-valid	Pass@64	47.5	Evariste-7d
Mathematical Proofs	miniF2F-valid	Pass@64	47.3	GPT-f
Mathematical Proofs	miniF2F-valid	Pass@64	46.7	Evariste-1d
Mathematical Proofs	miniF2F-curriculum	Pass@64	42.5	Evariste-7d
Mathematical Proofs	miniF2F-curriculum	Pass@64	33.6	Evariste-1d
Mathematical Proofs	miniF2F-curriculum	Pass@64	32.1	Evariste
Mathematical Proofs	miniF2F-curriculum	Pass@64	30.6	GPT-f
Mathematical Proofs	miniF2F-test	Pass@64	41	Evariste
Mathematical Proofs	miniF2F-test	cumulative	41	Evariste
Mathematical Proofs	miniF2F-test	Pass@64	40.6	Evariste-7d
Mathematical Proofs	miniF2F-test	cumulative	40.6	Evariste-7d
Mathematical Proofs	miniF2F-test	Pass@64	38.9	Evariste-1d
Mathematical Proofs	miniF2F-test	cumulative	38.9	Evariste-1d
Mathematical Proofs	miniF2F-test	Pass@64	36.6	GPT-f
Mathematical Proofs	miniF2F-test	cumulative	36.6	GPT-f

HyperTree Proof Search for Neural Theorem Proving

Abstract

Results

Related Papers

HyperTree Proof Search for Neural Theorem Proving

Abstract

Results

Related Papers