Question Answering on ConvFinQA

Metric: Execution Accuracy (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Execution Accuracy▼	Extra Data	Paper	Date↕	Code
1	APOLLO	78.76	No	APOLLO: An Optimized Training Approach for Long-...	2022-12-14	Code
2	GPT-4 (8k)	76.48	No	Are ChatGPT and GPT-4 General-Purpose Solvers fo...	2023-05-10	-
3	FinQANet (RoBERTa-large)	68.9	No	ConvFinQA: Exploring the Chain of Numerical Reas...	2022-10-07	Code
4	FinQANet (RoBERTa-large)	68.9	No	ConvFinQA: Exploring the Chain of Numerical Reas...	2022-10-07	Code
5	General Crowd	46.9	No	Are ChatGPT and GPT-4 General-Purpose Solvers fo...	2023-05-10	-

#1APOLLOSOTA
78.76
Execution Accuracy· 2022-12-14
APOLLO: An Optimized Training Approach for Long-form Numerical Reasoning Code
#2GPT-4 (8k)
76.48
Execution Accuracy· 2023-05-10
Are ChatGPT and GPT-4 General-Purpose Solvers for Financial Text Analytics? A Study on Several Typical Tasks
#3FinQANet (RoBERTa-large)SOTA
68.9
Execution Accuracy· 2022-10-07
ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering Code
#4FinQANet (RoBERTa-large)
68.9
Execution Accuracy· 2022-10-07
ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering Code
#5General Crowd
46.9
Execution Accuracy· 2023-05-10
Are ChatGPT and GPT-4 General-Purpose Solvers for Financial Text Analytics? A Study on Several Typical Tasks