Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: PongNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: -21.00 +/- 0.00
       name: mean_reward
       verified: false
 ---
@@ -72,7 +72,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 100000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: PongNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: -20.60 +/- 0.92
       name: mean_reward
       verified: false
 ---
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 200000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 4291397145
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 3583354604
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 100000.0
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 200000.0
   - - optimize_memory_usage
     - false
   - - policy

dqn-PongNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84f8ac7b857f3b48226e15202a0ece88470c78c4fd79363606ea4c6ff60e176f
-size 13719746

 version https://git-lfs.github.com/spec/v1
+oid sha256:2919c21849acac4f144df0fee5a943815304208cb13ed52f4380e3dffa577a18
+size 27224802

dqn-PongNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-PongNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f1e067afe9912f3dd1b7925918b8cbe439229f6008e572c9c7e431ae731419f1
-size 687

 version https://git-lfs.github.com/spec/v1
+oid sha256:31e2d323b4f81782fcde1c62d2ae4caa8b8f4475b750c0785d4e46ac745e6f14
+size 13505739

dqn-PongNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c02817f5ed705edcf80e74c2404c1463fcac9ebe112ebd87a6e50295851a5c9c
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:11010d8b9116aeec11ffeacc516d28fed7bf82e9388eda1b5b1aea17df51268c
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96f60e1f64134d580fe85bec2d75ae24678756708ec9f746e32f5f4ab5e6f652
-size 49746

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c07944d0675eda11092738b33d590d07979274c87243d956960844a0223ee3f
+size 64778

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": -21.0, "std_reward": 0.0, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-02-~~16T16~~:56:26.~~260303~~"}


1	+ {"mean_reward": -20.6, "std_reward": 0.9165151389911681, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-02-16T17:48:07.128553"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:053cf5a4928ec9725af6928965addb9b67f21cf2e11e9fd201fda7b699b4e902
-size 3816

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc318d165a9ecd80ba2cab6032a03495f7359e522a8a2ba1f0d481349f69ed5a
+size 6927