epoch 9 pgd_25_0.1_eps

Reported on 8 benchmarks across 1 task

Note: results are matched by exact model name. Different papers may use the same name for different model variants.

Reasoning8 results

Visual ReasoningonCLEVRER
Average-per ques.
60.25
best: 95.24 (AI Core)
Visual ReasoningonCLEVRER
Counterfactual-per opt.
66.65
best: 96.61 (AI Core)
Visual ReasoningonCLEVRER
Counterfactual-per ques.
25.89
best: 90.72 (AI Core)
Visual ReasoningonCLEVRER
Descriptive
81.39
best: 96.46 (AI Core)
Visual ReasoningonCLEVRER
Explanatory-per opt.
83.42
best: 99.94 (AI Core)
Visual ReasoningonCLEVRER
Explanatory-per ques.
72.78
best: 99.81 (AI Core)
Visual ReasoningonCLEVRER
Predictive-per opt.
78.5
best: 95.69 (redherring)
Visual ReasoningonCLEVRER
Predictive-per ques.
60.95
best: 93.96 (AI Core)