Training in progress, step 4000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model-00001-of-00002.safetensors +1 -1
last-checkpoint/model-00002-of-00002.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +254 -5

last-checkpoint/model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:374ed8949342602163ff342ab341b7f2396c86df086fc325532b8011637eade8
 size 4993448880

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0dc78eb3736d5a634642f33b04366ae8bc82d44f79e35262912a8f79a297da9
 size 4993448880

last-checkpoint/model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:afa46570533cc904339e6f587cf429f834efd131ac812971f1bbe438d6109678
 size 1180663192

 version https://git-lfs.github.com/spec/v1
+oid sha256:8dd0b804f4d8175687f3626e929c7766181c67e2d08bc33bc20168248f4a9ba9
 size 1180663192

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:401fa0df85ea07bc908110453d152ebafc1f512885a204e1dfe675e1f118de6f
 size 3095446256

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b9a68cbcd5de279cabaa6560612707ffd9ca1a64ece09207391eab36fc73a58
 size 3095446256

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80e397e2074aa93e5dab4d712d0187ee9f61d0160362667daac2e2f5af3c9baa
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b7b6ce3ff2951e767c721be76510187471b655709a639fc1d52c719fdc5af80
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:88b9dc452a973f46fe6cf13a85f3a4e2b3a33ff360bd385917df50f48d4a73a2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:34d49fca63da670319ba76874c77a485016cecfb604305dc12d82741a53f00d7
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 38.2982234200539,
-  "best_model_checkpoint": "warmestman/whisper-large-v3-mn-cv-fleurs/checkpoint-2000",
-  "epoch": 17.964071856287426,
   "eval_steps": 1000,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -754,6 +754,255 @@
       "eval_steps_per_second": 0.092,
       "eval_wer": 38.54023431054397,
       "step": 3000
     }
   ],
   "logging_steps": 25,
@@ -761,7 +1010,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 60,
   "save_steps": 1000,
-  "total_flos": 1.6290664630124544e+20,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 38.127715747208626,
+  "best_model_checkpoint": "warmestman/whisper-large-v3-mn-cv-fleurs/checkpoint-4000",
+  "epoch": 23.952095808383234,
   "eval_steps": 1000,
+  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.092,
       "eval_wer": 38.54023431054397,
       "step": 3000
+    },
+    {
+      "epoch": 18.11,
+      "learning_rate": 7.342105263157895e-05,
+      "loss": 0.0094,
+      "step": 3025
+    },
+    {
+      "epoch": 18.26,
+      "learning_rate": 7.315789473684212e-05,
+      "loss": 0.0085,
+      "step": 3050
+    },
+    {
+      "epoch": 18.41,
+      "learning_rate": 7.289473684210527e-05,
+      "loss": 0.0089,
+      "step": 3075
+    },
+    {
+      "epoch": 18.56,
+      "learning_rate": 7.263157894736843e-05,
+      "loss": 0.0101,
+      "step": 3100
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 7.236842105263159e-05,
+      "loss": 0.0091,
+      "step": 3125
+    },
+    {
+      "epoch": 18.86,
+      "learning_rate": 7.210526315789474e-05,
+      "loss": 0.0106,
+      "step": 3150
+    },
+    {
+      "epoch": 19.01,
+      "learning_rate": 7.18421052631579e-05,
+      "loss": 0.01,
+      "step": 3175
+    },
+    {
+      "epoch": 19.16,
+      "learning_rate": 7.157894736842105e-05,
+      "loss": 0.0067,
+      "step": 3200
+    },
+    {
+      "epoch": 19.31,
+      "learning_rate": 7.131578947368421e-05,
+      "loss": 0.0077,
+      "step": 3225
+    },
+    {
+      "epoch": 19.46,
+      "learning_rate": 7.105263157894737e-05,
+      "loss": 0.0072,
+      "step": 3250
+    },
+    {
+      "epoch": 19.61,
+      "learning_rate": 7.078947368421052e-05,
+      "loss": 0.0066,
+      "step": 3275
+    },
+    {
+      "epoch": 19.76,
+      "learning_rate": 7.052631578947368e-05,
+      "loss": 0.0073,
+      "step": 3300
+    },
+    {
+      "epoch": 19.91,
+      "learning_rate": 7.026315789473684e-05,
+      "loss": 0.0079,
+      "step": 3325
+    },
+    {
+      "epoch": 20.06,
+      "learning_rate": 7e-05,
+      "loss": 0.0101,
+      "step": 3350
+    },
+    {
+      "epoch": 20.21,
+      "learning_rate": 6.973684210526315e-05,
+      "loss": 0.0075,
+      "step": 3375
+    },
+    {
+      "epoch": 20.36,
+      "learning_rate": 6.947368421052632e-05,
+      "loss": 0.0096,
+      "step": 3400
+    },
+    {
+      "epoch": 20.51,
+      "learning_rate": 6.921052631578948e-05,
+      "loss": 0.0095,
+      "step": 3425
+    },
+    {
+      "epoch": 20.66,
+      "learning_rate": 6.894736842105263e-05,
+      "loss": 0.0105,
+      "step": 3450
+    },
+    {
+      "epoch": 20.81,
+      "learning_rate": 6.868421052631579e-05,
+      "loss": 0.0112,
+      "step": 3475
+    },
+    {
+      "epoch": 20.96,
+      "learning_rate": 6.842105263157895e-05,
+      "loss": 0.0116,
+      "step": 3500
+    },
+    {
+      "epoch": 21.11,
+      "learning_rate": 6.81578947368421e-05,
+      "loss": 0.0088,
+      "step": 3525
+    },
+    {
+      "epoch": 21.26,
+      "learning_rate": 6.789473684210527e-05,
+      "loss": 0.01,
+      "step": 3550
+    },
+    {
+      "epoch": 21.41,
+      "learning_rate": 6.763157894736843e-05,
+      "loss": 0.01,
+      "step": 3575
+    },
+    {
+      "epoch": 21.56,
+      "learning_rate": 6.736842105263159e-05,
+      "loss": 0.0083,
+      "step": 3600
+    },
+    {
+      "epoch": 21.71,
+      "learning_rate": 6.710526315789474e-05,
+      "loss": 0.0088,
+      "step": 3625
+    },
+    {
+      "epoch": 21.86,
+      "learning_rate": 6.68421052631579e-05,
+      "loss": 0.0086,
+      "step": 3650
+    },
+    {
+      "epoch": 22.01,
+      "learning_rate": 6.657894736842106e-05,
+      "loss": 0.0078,
+      "step": 3675
+    },
+    {
+      "epoch": 22.16,
+      "learning_rate": 6.631578947368421e-05,
+      "loss": 0.0061,
+      "step": 3700
+    },
+    {
+      "epoch": 22.31,
+      "learning_rate": 6.605263157894738e-05,
+      "loss": 0.0073,
+      "step": 3725
+    },
+    {
+      "epoch": 22.46,
+      "learning_rate": 6.578947368421054e-05,
+      "loss": 0.0071,
+      "step": 3750
+    },
+    {
+      "epoch": 22.6,
+      "learning_rate": 6.55263157894737e-05,
+      "loss": 0.0085,
+      "step": 3775
+    },
+    {
+      "epoch": 22.75,
+      "learning_rate": 6.526315789473685e-05,
+      "loss": 0.0082,
+      "step": 3800
+    },
+    {
+      "epoch": 22.9,
+      "learning_rate": 6.500000000000001e-05,
+      "loss": 0.0098,
+      "step": 3825
+    },
+    {
+      "epoch": 23.05,
+      "learning_rate": 6.473684210526316e-05,
+      "loss": 0.0087,
+      "step": 3850
+    },
+    {
+      "epoch": 23.2,
+      "learning_rate": 6.447368421052632e-05,
+      "loss": 0.0087,
+      "step": 3875
+    },
+    {
+      "epoch": 23.35,
+      "learning_rate": 6.421052631578948e-05,
+      "loss": 0.0076,
+      "step": 3900
+    },
+    {
+      "epoch": 23.5,
+      "learning_rate": 6.394736842105263e-05,
+      "loss": 0.0077,
+      "step": 3925
+    },
+    {
+      "epoch": 23.65,
+      "learning_rate": 6.368421052631579e-05,
+      "loss": 0.0081,
+      "step": 3950
+    },
+    {
+      "epoch": 23.8,
+      "learning_rate": 6.342105263157895e-05,
+      "loss": 0.0083,
+      "step": 3975
+    },
+    {
+      "epoch": 23.95,
+      "learning_rate": 6.31578947368421e-05,
+      "loss": 0.0091,
+      "step": 4000
+    },
+    {
+      "epoch": 23.95,
+      "eval_loss": 0.5618667602539062,
+      "eval_runtime": 582.8261,
+      "eval_samples_per_second": 0.719,
+      "eval_steps_per_second": 0.091,
+      "eval_wer": 38.127715747208626,
+      "step": 4000
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 60,
   "save_steps": 1000,
+  "total_flos": 2.1720546423668736e+20,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null