OpenAI Gym on Walker2d-v4

Metric: Average Return (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Average Return▼	Extra Data	Paper	Date↕	Code
1	SAC	5745.27	No	Soft Actor-Critic: Off-Policy Maximum Entropy De...	2018-01-04	Code
2	MEow	5526.66	No	Maximum Entropy Reinforcement Learning via Energ...	2024-05-22	Code
3	DDPG	2994.54	No	Continuous control with deep reinforcement learn...	2015-09-09	Code
4	PPO	2739.81	No	Proximal Policy Optimization Algorithms	2017-07-20	Code
5	TD3	2612.74	No	Addressing Function Approximation Error in Actor...	2018-02-26	Code

#1SACSOTA
5745.27
Average Return· 2018-01-04
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Code
#2MEow
5526.66
Average Return· 2024-05-22
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow Code
#3DDPGSOTA
2994.54
Average Return· 2015-09-09
Continuous control with deep reinforcement learning Code
#4PPO
2739.81
Average Return· 2017-07-20
Proximal Policy Optimization Algorithms Code
#5TD3
2612.74
Average Return· 2018-02-26
Addressing Function Approximation Error in Actor-Critic Methods Code