Tasks SotA Datasets Papers Methods Submit About

Papers With Code 2

A community resource for machine learning research: papers, code, benchmarks, and state-of-the-art results.

Explore

Notable Benchmarks All SotA Datasets Papers Methods

Community

Submit Results About

Data sourced from the PWC Archive (CC-BY-SA 4.0). Built by the community, for the community.

Models/Claude-2

Claude-2

Reported on 15 benchmarks across 1 task

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Natural Language Processing15 results

Long-Context UnderstandingonAda-LEval (BestAnswer)
12k
12
best: 52 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (BestAnswer)
16k
11
best: 44.5 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (BestAnswer)
1k
65
best: 74 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (BestAnswer)
2k
43.5
best: 73.5 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (BestAnswer)
32k
4
best: 30 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (BestAnswer)
4k
23.5
best: 67.5 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (BestAnswer)
64k
0
best: 0.5 (InternLM2-7b)
Long-Context UnderstandingonAda-LEval (BestAnswer)
6k
15
best: 63 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (BestAnswer)
8k
17
best: 56.5 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (TSort)
16k
3
best: 5.5 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (TSort)
2k
5
best: 18.5 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (TSort)
32k
0
best: 6 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (TSort)
4k
5
best: 16.5 (GPT-4-Turbo-0125)
Long-Context UnderstandingonAda-LEval (TSort)
64k
0
best: 6 (GPT-4-Turbo-1106)
Long-Context UnderstandingonAda-LEval (TSort)
8k
4.5
best: 8.5 (GPT-4-Turbo-0125)