Training in progress, epoch 2

Browse files

Files changed (8) hide show

logs/events.out.tfevents.1709872398.6c1c016b0e3e.7263.0 +2 -2
model.safetensors +1 -1
run-0/checkpoint-96/model.safetensors +1 -1
run-0/checkpoint-96/optimizer.pt +1 -1
run-0/checkpoint-96/rng_state.pth +1 -1
run-0/checkpoint-96/scheduler.pt +1 -1
run-0/checkpoint-96/trainer_state.json +42 -23
run-0/checkpoint-96/training_args.bin +1 -1

logs/events.out.tfevents.1709872398.6c1c016b0e3e.7263.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aba27c272f71ae8cd6972aa68b8f1b09c93b6c05245499b5a550cad17221f3a2
-size 5314

 version https://git-lfs.github.com/spec/v1
+oid sha256:1915b6a2c06d155db3570a3e7513c6285734d3e6cfb61979d5cb5ebe64b0f2a2
+size 5984

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:45b4b95ef18e9ad28c7043735a6cae19edb8de8cca02e86dd2739757a4f1dc6d
 size 17549312

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9deaf7b9483814e8658af2bd540c9c428e1d9d74902b8546da37c62a418f2b8
 size 17549312

run-0/checkpoint-96/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c92adc7dcf01e1fbb05511c4493199b42d344e3981283ab521c477e538f9aceb
 size 17549312

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9deaf7b9483814e8658af2bd540c9c428e1d9d74902b8546da37c62a418f2b8
 size 17549312

run-0/checkpoint-96/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db3824b1c6f237bcf65a54ea4cca3aa03e4cfa3c81a3b6afc4e72e03c759249e
 size 35122746

 version https://git-lfs.github.com/spec/v1
+oid sha256:5e8f5ef6ee86d49f7eb75c8214eefcb88b1a2166ac8c9a098a261f23125fce34
 size 35122746

run-0/checkpoint-96/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24aa86019b8aea1c551cc1adaf38c4db2fc01de75a22af312230f6b592e0fd81
 size 14054

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bc13e09b59a62b6fb29cad756bfeefcce6f512c71a9054cc39e336db0b532a5
 size 14054

run-0/checkpoint-96/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43ddd3b1c41613cd7e1e1227d929645b76a450f62d1a6ce5575c2f7873d9d0b6
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bd902627d0c1d565c70987837a95a63c8ee21875132d3259ea0ce69d0e7372a
 size 1064

run-0/checkpoint-96/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 0.7514677103718199,
-  "best_model_checkpoint": "tiny-bert-sst2-distilled/run-0/checkpoint-96",
-  "epoch": 1.0,
   "eval_steps": 500,
   "global_step": 96,
   "is_hyper_param_search": true,
@@ -10,36 +10,55 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "grad_norm": 1.6740443706512451,
-      "learning_rate": 0.0001218354408608861,
-      "loss": 0.4816,
-      "step": 96
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.7514677103718199,
-      "eval_f1": 0.7519531250000001,
-      "eval_loss": 0.41538161039352417,
-      "eval_precision": 0.7504873294346979,
-      "eval_recall": 0.7534246575342466,
-      "eval_runtime": 26.5175,
-      "eval_samples_per_second": 38.541,
-      "eval_steps_per_second": 1.207,
       "step": 96
     }
   ],
   "logging_steps": 500,
-  "max_steps": 480,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
-  "total_flos": 235695197280.0,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.679174768290245,
-    "learning_rate": 0.00015229430107610762,
-    "num_train_epochs": 5,
-    "temperature": 27
   }
 }

 {
+  "best_metric": 0.5,
+  "best_model_checkpoint": "tiny-bert-sst2-distilled/run-0/checkpoint-48",
+  "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 96,
   "is_hyper_param_search": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "grad_norm": 1.7277214527130127,
+      "learning_rate": 7.1080634981543736e-06,
+      "loss": 0.4421,
+      "step": 48
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.0,
+      "eval_loss": 0.4095905125141144,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 28.1077,
+      "eval_samples_per_second": 36.36,
+      "eval_steps_per_second": 0.569,
+      "step": 48
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 0.3527555465698242,
+      "learning_rate": 3.5540317490771868e-06,
+      "loss": 0.4039,
+      "step": 96
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.5,
+      "eval_f1": 0.0,
+      "eval_loss": 0.39591261744499207,
+      "eval_precision": 0.0,
+      "eval_recall": 0.0,
+      "eval_runtime": 27.762,
+      "eval_samples_per_second": 36.813,
+      "eval_steps_per_second": 0.576,
       "step": 96
     }
   ],
   "logging_steps": 500,
+  "max_steps": 144,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 471390394560.0,
+  "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.48386139243976256,
+    "learning_rate": 1.066209524723156e-05,
+    "num_train_epochs": 3,
+    "temperature": 23
   }
 }

run-0/checkpoint-96/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1873f3a503b2d5b3f7200baa33f737ba864dd65edb3834d85c5b8e40b6b72f07
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:103518af05e87893001984e8fe4e4fbdef270179595accd70434e2248c87999d
 size 4920