Training in progress, step 40, checkpoint

Files changed (4) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:356e77737e1ae57c572cefec580a243ff3bf580fbabb7d8184cf96c4dc8f3524
 size 723676832

 version https://git-lfs.github.com/spec/v1
+oid sha256:ed1ed9d8dfa9dd55b199bc5e21c0811819d1ab75ccfaea1ddfdae9a96f62b60d
 size 723676832

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ceb1e871d2adeb06e378f9b3dd9f505b3cc3347052040d028a70c5698d6ed5f4
 size 735627290

 version https://git-lfs.github.com/spec/v1
+oid sha256:4c7997c91fa3548efba8ca037e07ebcad875744d69d906895ad8baef3f316380
 size 735627290

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -11,53 +11,53 @@
     {
       "epoch": 0.001183431952662722,
       "eval_loss": 2.9618937969207764,
-      "eval_runtime": 5.2129,
-      "eval_samples_per_second": 288.133,
-      "eval_steps_per_second": 18.032,
       "step": 1
     },
     {
       "epoch": 0.011834319526627219,
       "grad_norm": 4.4375,
       "learning_rate": 1.6000000000000003e-05,
-      "loss": 2.6559,
       "step": 10
     },
     {
       "epoch": 0.023668639053254437,
       "grad_norm": 1.6328125,
       "learning_rate": 3.2000000000000005e-05,
-      "loss": 2.7912,
       "step": 20
     },
     {
       "epoch": 0.023668639053254437,
-      "eval_loss": 2.9339327812194824,
-      "eval_runtime": 5.5967,
-      "eval_samples_per_second": 268.371,
-      "eval_steps_per_second": 16.796,
       "step": 20
     },
     {
       "epoch": 0.03550295857988166,
       "grad_norm": 6.34375,
       "learning_rate": 4.8e-05,
-      "loss": 2.8945,
       "step": 30
     },
     {
       "epoch": 0.047337278106508875,
       "grad_norm": 2.1875,
       "learning_rate": 6.400000000000001e-05,
-      "loss": 2.7552,
       "step": 40
     },
     {
       "epoch": 0.047337278106508875,
-      "eval_loss": 2.7184391021728516,
-      "eval_runtime": 5.6084,
-      "eval_samples_per_second": 267.814,
-      "eval_steps_per_second": 16.761,
       "step": 40
     }
   ],

     {
       "epoch": 0.001183431952662722,
       "eval_loss": 2.9618937969207764,
+      "eval_runtime": 5.153,
+      "eval_samples_per_second": 291.48,
+      "eval_steps_per_second": 18.242,
       "step": 1
     },
     {
       "epoch": 0.011834319526627219,
       "grad_norm": 4.4375,
       "learning_rate": 1.6000000000000003e-05,
+      "loss": 2.6542,
       "step": 10
     },
     {
       "epoch": 0.023668639053254437,
       "grad_norm": 1.6328125,
       "learning_rate": 3.2000000000000005e-05,
+      "loss": 2.79,
       "step": 20
     },
     {
       "epoch": 0.023668639053254437,
+      "eval_loss": 2.9338200092315674,
+      "eval_runtime": 5.4254,
+      "eval_samples_per_second": 276.844,
+      "eval_steps_per_second": 17.326,
       "step": 20
     },
     {
       "epoch": 0.03550295857988166,
       "grad_norm": 6.34375,
       "learning_rate": 4.8e-05,
+      "loss": 2.8939,
       "step": 30
     },
     {
       "epoch": 0.047337278106508875,
       "grad_norm": 2.1875,
       "learning_rate": 6.400000000000001e-05,
+      "loss": 2.7567,
       "step": 40
     },
     {
       "epoch": 0.047337278106508875,
+      "eval_loss": 2.7183806896209717,
+      "eval_runtime": 5.4234,
+      "eval_samples_per_second": 276.95,
+      "eval_steps_per_second": 17.332,
       "step": 40
     }
   ],

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7337b093c5d7d6a10f8669867e0be91b7b9af804f42fa136237f8529e7181224
 size 6840

 version https://git-lfs.github.com/spec/v1
+oid sha256:55fb1fb11393c44950fb4dfab07de848902eaeb6dba9ba2c18239d02cde2e9ba
 size 6840