Ryukijano
/

gemma-groot

@@ -137,17 +137,17 @@
         "optimizer_lr": 0.0001,
         "optimizer_weight_decay": 1e-06
     },
-    "output_dir": "outputs/train/2025-08-12/04-22-09_gemma_le",
     "job_name": "gemma_le",
     "resume": false,
     "seed": 1000,
-    "num_workers": 4,
-    "batch_size": 2,
-    "steps": 60000,
     "eval_freq": 20000,
-    "log_freq": 100,
     "save_checkpoint": true,
-    "save_freq": 20000,
     "use_policy_training_preset": true,
     "optimizer": {
         "type": "adamw",
@@ -176,8 +176,8 @@
     },
     "progress_bar": true,
     "push_to_hub": false,
-    "push_repo_id": "Ryukijano/gemma-groot",
-    "push_branch": "main",
     "push_private": false,
-    "push_exist_ok": true
 }

         "optimizer_lr": 0.0001,
         "optimizer_weight_decay": 1e-06
     },
+    "output_dir": "outputs/train/2025-08-12/13-06-07_gemma_le",
     "job_name": "gemma_le",
     "resume": false,
     "seed": 1000,
+    "num_workers": 0,
+    "batch_size": 1,
+    "steps": 20000,
     "eval_freq": 20000,
+    "log_freq": 10,
     "save_checkpoint": true,
+    "save_freq": 5000,
     "use_policy_training_preset": true,
     "optimizer": {
         "type": "adamw",
     },
     "progress_bar": true,
     "push_to_hub": false,
+    "push_repo_id": null,
+    "push_branch": null,
     "push_private": false,
+    "push_exist_ok": false
 }