bguan
/

lunar_lander_v2_ppo_5

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

lunar_lander_v2_ppo_5 / results.json

Commit History

lunar lander model #5, using PPO trained with learning rate 0.0005, gamma 0.995, for 1M timesteps

57e96c5

bguan commited on May 10, 2022

lunar lander model #5, using PPO trained with learning rate 0.0005, gamma 0.995, for 1M timesteps

1e0b940

bguan commited on May 10, 2022