OpenAI Gym on Hopper-v4

Metric: Average Return (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Average Return▼	Extra Data	Paper	Date↕	Code
1	MEow	3332.99	No	Maximum Entropy Reinforcement Learning via Energ...	2024-05-22	Code
2	TD3	3319.98	No	Addressing Function Approximation Error in Actor...	2018-02-26	Code
3	SAC	2882.56	No	Soft Actor-Critic: Off-Policy Maximum Entropy De...	2018-01-04	Code
4	DDPG	1290.24	No	Continuous control with deep reinforcement learn...	2015-09-09	Code
5	PPO	790.77	No	Proximal Policy Optimization Algorithms	2017-07-20	Code

#1MEowSOTA
3332.99
Average Return· 2024-05-22
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow Code
#2TD3SOTA
3319.98
Average Return· 2018-02-26
Addressing Function Approximation Error in Actor-Critic Methods Code
#3SACSOTA
2882.56
Average Return· 2018-01-04
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Code
#4DDPGSOTA
1290.24
Average Return· 2015-09-09
Continuous control with deep reinforcement learning Code
#5PPO
790.77
Average Return· 2017-07-20
Proximal Policy Optimization Algorithms Code