Upload 13 files

Files changed (6) hide show

all_results.json CHANGED Viewed

@@ -1,16 +1,16 @@
 {
-    "epoch": 10.0,
-    "eval_loss": 1.8425856828689575,
-    "eval_runtime": 78.2516,
-    "eval_samples": 83311,
-    "eval_samples_per_second": 1064.656,
-    "eval_steps_per_second": 133.084,
-    "num_input_tokens_seen": 224864981,
-    "total_flos": 5.955121238645146e+16,
-    "train_loss": 1.7257680629754402,
-    "train_runtime": 16392.488,
-    "train_samples": 333243,
-    "train_samples_per_second": 203.29,
-    "train_steps_per_second": 25.412,
-    "train_tokens_per_second": 13715.035
 }

 {
+    "epoch": 5.0,
+    "eval_loss": 0.9877662062644958,
+    "eval_runtime": 191.8575,
+    "eval_samples": 199905,
+    "eval_samples_per_second": 1041.945,
+    "eval_steps_per_second": 130.248,
+    "num_input_tokens_seen": 270444104,
+    "total_flos": 7.16219760157655e+16,
+    "train_loss": 0.8578685343122414,
+    "train_runtime": 15819.1918,
+    "train_samples": 799616,
+    "train_samples_per_second": 252.736,
+    "train_steps_per_second": 31.592,
+    "train_tokens_per_second": 17096.35
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 10.0,
-    "eval_loss": 1.8425856828689575,
-    "eval_runtime": 78.2516,
-    "eval_samples": 83311,
-    "eval_samples_per_second": 1064.656,
-    "eval_steps_per_second": 133.084,
-    "num_input_tokens_seen": 224864981
 }

 {
+    "epoch": 5.0,
+    "eval_loss": 0.9877662062644958,
+    "eval_runtime": 191.8575,
+    "eval_samples": 199905,
+    "eval_samples_per_second": 1041.945,
+    "eval_steps_per_second": 130.248,
+    "num_input_tokens_seen": 270444104
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f64d3422f29320e25c3147ccad3fd8c2ff33f21c304ce3fef5ad0635cb65a1b
 size 309965092

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2698bb7b6baef60d957fc165adb6fe41d9c331e3c9f8636a06b445e14ccde26
 size 309965092

train_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-    "epoch": 10.0,
-    "num_input_tokens_seen": 224864981,
-    "total_flos": 5.955121238645146e+16,
-    "train_loss": 1.7257680629754402,
-    "train_runtime": 16392.488,
-    "train_samples": 333243,
-    "train_samples_per_second": 203.29,
-    "train_steps_per_second": 25.412,
-    "train_tokens_per_second": 13715.035
 }

 {
+    "epoch": 5.0,
+    "num_input_tokens_seen": 270444104,
+    "total_flos": 7.16219760157655e+16,
+    "train_loss": 0.8578685343122414,
+    "train_runtime": 15819.1918,
+    "train_samples": 799616,
+    "train_samples_per_second": 252.736,
+    "train_steps_per_second": 31.592,
+    "train_tokens_per_second": 17096.35
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e21d4704e53ce765ad8089f6ad1256599250b602615c481e5a598d83131099ba
-size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bd88c026fb1afd3024d926e8768bbb2f364125b062859865bf66ce94ac883e1
+size 5560