OpenAI Gym on Humanoid-v4

Metric: Average Return (higher is better)

LeaderboardDataset

Loading chart...

Results

Submit a result

Sort:

#	Model↕	Average Return▼	Extra Data	Paper	Date↕	Code
1	MEow	6923.22	No	Maximum Entropy Reinforcement Learning via Energ...	2024-05-22	Code
2	SAC	6211.5	No	Soft Actor-Critic: Off-Policy Maximum Entropy De...	2018-01-04	Code
3	PPO	925.89	No	Proximal Policy Optimization Algorithms	2017-07-20	Code
4	TD3	198.44	No	Addressing Function Approximation Error in Actor...	2018-02-26	Code
5	DDPG	139.14	No	Continuous control with deep reinforcement learn...	2015-09-09	Code

#1MEowSOTA
6923.22
Average Return· 2024-05-22
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow Code
#2SACSOTA
6211.5
Average Return· 2018-01-04
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Code
#3PPOSOTA
925.89
Average Return· 2017-07-20
Proximal Policy Optimization Algorithms Code
#4TD3
198.44
Average Return· 2018-02-26
Addressing Function Approximation Error in Actor-Critic Methods Code
#5DDPGSOTA
139.14
Average Return· 2015-09-09
Continuous control with deep reinforcement learning Code