End of training

Browse files

Files changed (6) hide show

README.md +8 -6
all_results.json +15 -0
eval_results.json +9 -0
runs/Feb14_22-20-51_server1/events.out.tfevents.1739567371.server1 +3 -0
train_results.json +9 -0
trainer_state.json +277 -0

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ library_name: transformers
 license: apache-2.0
 base_model: facebook/wav2vec2-large-lv60
 tags:
 - generated_from_trainer
 datasets:
 - librispeech_asr
@@ -15,15 +17,15 @@ model-index:
       name: Automatic Speech Recognition
       type: automatic-speech-recognition
     dataset:
-      name: librispeech_asr
       type: librispeech_asr
       config: clean
       split: test
-      args: clean
     metrics:
     - name: Wer
       type: wer
-      value: 1.0237341772151898
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -31,10 +33,10 @@ should probably proofread and complete it, then remove this comment. -->
 # wav2vec2-librispeech-demo
-This model is a fine-tuned version of [facebook/wav2vec2-large-lv60](https://huggingface.co/facebook/wav2vec2-large-lv60) on the librispeech_asr dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0031
-- Wer: 1.0237
 ## Model description

 license: apache-2.0
 base_model: facebook/wav2vec2-large-lv60
 tags:
+- automatic-speech-recognition
+- librispeech_asr
 - generated_from_trainer
 datasets:
 - librispeech_asr
       name: Automatic Speech Recognition
       type: automatic-speech-recognition
     dataset:
+      name: LIBRISPEECH_ASR - CLEAN
       type: librispeech_asr
       config: clean
       split: test
+      args: 'Config: clean, Training split: test, Eval split: test'
     metrics:
     - name: Wer
       type: wer
+      value: 1.0225474683544304
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 # wav2vec2-librispeech-demo
+This model is a fine-tuned version of [facebook/wav2vec2-large-lv60](https://huggingface.co/facebook/wav2vec2-large-lv60) on the LIBRISPEECH_ASR - CLEAN dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0030
+- Wer: 1.0225
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 15.0,
+    "eval_loss": 0.00301616033539176,
+    "eval_runtime": 315.0397,
+    "eval_samples": 2528,
+    "eval_samples_per_second": 8.024,
+    "eval_steps_per_second": 1.003,
+    "eval_wer": 1.0225474683544304,
+    "total_flos": 7.984243073297488e+18,
+    "train_loss": 0.8373936769831533,
+    "train_runtime": 15099.3203,
+    "train_samples": 2528,
+    "train_samples_per_second": 2.511,
+    "train_steps_per_second": 0.157
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 15.0,
+    "eval_loss": 0.00301616033539176,
+    "eval_runtime": 315.0397,
+    "eval_samples": 2528,
+    "eval_samples_per_second": 8.024,
+    "eval_steps_per_second": 1.003,
+    "eval_wer": 1.0225474683544304
+}

runs/Feb14_22-20-51_server1/events.out.tfevents.1739567371.server1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ac868ed3bcde6abfeb28a7bb2749551fe6893593282cb0357d64242d28add20
+size 40

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 15.0,
+    "total_flos": 7.984243073297488e+18,
+    "train_loss": 0.8373936769831533,
+    "train_runtime": 15099.3203,
+    "train_samples": 2528,
+    "train_samples_per_second": 2.511,
+    "train_steps_per_second": 0.157
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,277 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 15.0,
+  "eval_steps": 100,
+  "global_step": 2370,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.6329113924050633,
+      "eval_loss": 3.940936803817749,
+      "eval_runtime": 314.2197,
+      "eval_samples_per_second": 8.045,
+      "eval_steps_per_second": 1.006,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 1.2658227848101267,
+      "eval_loss": 3.044066905975342,
+      "eval_runtime": 313.2217,
+      "eval_samples_per_second": 8.071,
+      "eval_steps_per_second": 1.009,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 1.8987341772151898,
+      "eval_loss": 2.9164648056030273,
+      "eval_runtime": 317.0806,
+      "eval_samples_per_second": 7.973,
+      "eval_steps_per_second": 0.997,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 2.5316455696202533,
+      "eval_loss": 1.4924770593643188,
+      "eval_runtime": 316.4362,
+      "eval_samples_per_second": 7.989,
+      "eval_steps_per_second": 0.999,
+      "eval_wer": 1.9968354430379747,
+      "step": 400
+    },
+    {
+      "epoch": 3.1645569620253164,
+      "grad_norm": 0.8539223670959473,
+      "learning_rate": 0.0002982,
+      "loss": 3.7012,
+      "step": 500
+    },
+    {
+      "epoch": 3.1645569620253164,
+      "eval_loss": 0.30101653933525085,
+      "eval_runtime": 312.8326,
+      "eval_samples_per_second": 8.081,
+      "eval_steps_per_second": 1.01,
+      "eval_wer": 1.9446202531645569,
+      "step": 500
+    },
+    {
+      "epoch": 3.7974683544303796,
+      "eval_loss": 0.17126257717609406,
+      "eval_runtime": 314.312,
+      "eval_samples_per_second": 8.043,
+      "eval_steps_per_second": 1.005,
+      "eval_wer": 1.8259493670886076,
+      "step": 600
+    },
+    {
+      "epoch": 4.430379746835443,
+      "eval_loss": 0.09897234290838242,
+      "eval_runtime": 312.6958,
+      "eval_samples_per_second": 8.085,
+      "eval_steps_per_second": 1.011,
+      "eval_wer": 1.6162974683544304,
+      "step": 700
+    },
+    {
+      "epoch": 5.063291139240507,
+      "eval_loss": 0.06915320456027985,
+      "eval_runtime": 317.6492,
+      "eval_samples_per_second": 7.958,
+      "eval_steps_per_second": 0.995,
+      "eval_wer": 1.5439082278481013,
+      "step": 800
+    },
+    {
+      "epoch": 5.69620253164557,
+      "eval_loss": 0.046260952949523926,
+      "eval_runtime": 321.8259,
+      "eval_samples_per_second": 7.855,
+      "eval_steps_per_second": 0.982,
+      "eval_wer": 1.423259493670886,
+      "step": 900
+    },
+    {
+      "epoch": 6.329113924050633,
+      "grad_norm": 0.26903435587882996,
+      "learning_rate": 0.00022026737967914436,
+      "loss": 0.1686,
+      "step": 1000
+    },
+    {
+      "epoch": 6.329113924050633,
+      "eval_loss": 0.038907092064619064,
+      "eval_runtime": 320.4174,
+      "eval_samples_per_second": 7.89,
+      "eval_steps_per_second": 0.986,
+      "eval_wer": 1.3469145569620253,
+      "step": 1000
+    },
+    {
+      "epoch": 6.962025316455696,
+      "eval_loss": 0.029044821858406067,
+      "eval_runtime": 320.649,
+      "eval_samples_per_second": 7.884,
+      "eval_steps_per_second": 0.986,
+      "eval_wer": 1.3101265822784811,
+      "step": 1100
+    },
+    {
+      "epoch": 7.594936708860759,
+      "eval_loss": 0.020351797342300415,
+      "eval_runtime": 316.4006,
+      "eval_samples_per_second": 7.99,
+      "eval_steps_per_second": 0.999,
+      "eval_wer": 1.1993670886075949,
+      "step": 1200
+    },
+    {
+      "epoch": 8.227848101265822,
+      "eval_loss": 0.016085166484117508,
+      "eval_runtime": 321.3591,
+      "eval_samples_per_second": 7.867,
+      "eval_steps_per_second": 0.983,
+      "eval_wer": 1.1839398734177216,
+      "step": 1300
+    },
+    {
+      "epoch": 8.860759493670885,
+      "eval_loss": 0.014270616695284843,
+      "eval_runtime": 314.8714,
+      "eval_samples_per_second": 8.029,
+      "eval_steps_per_second": 1.004,
+      "eval_wer": 1.1499208860759493,
+      "step": 1400
+    },
+    {
+      "epoch": 9.49367088607595,
+      "grad_norm": 1.2659544944763184,
+      "learning_rate": 0.00014005347593582887,
+      "loss": 0.0553,
+      "step": 1500
+    },
+    {
+      "epoch": 9.49367088607595,
+      "eval_loss": 0.011028471402823925,
+      "eval_runtime": 316.4518,
+      "eval_samples_per_second": 7.989,
+      "eval_steps_per_second": 0.999,
+      "eval_wer": 1.1459651898734178,
+      "step": 1500
+    },
+    {
+      "epoch": 10.126582278481013,
+      "eval_loss": 0.008157163858413696,
+      "eval_runtime": 315.7243,
+      "eval_samples_per_second": 8.007,
+      "eval_steps_per_second": 1.001,
+      "eval_wer": 1.0953322784810127,
+      "step": 1600
+    },
+    {
+      "epoch": 10.759493670886076,
+      "eval_loss": 0.008831300772726536,
+      "eval_runtime": 315.0431,
+      "eval_samples_per_second": 8.024,
+      "eval_steps_per_second": 1.003,
+      "eval_wer": 1.1119462025316456,
+      "step": 1700
+    },
+    {
+      "epoch": 11.39240506329114,
+      "eval_loss": 0.005905392114073038,
+      "eval_runtime": 319.3821,
+      "eval_samples_per_second": 7.915,
+      "eval_steps_per_second": 0.989,
+      "eval_wer": 1.0573575949367089,
+      "step": 1800
+    },
+    {
+      "epoch": 12.025316455696203,
+      "eval_loss": 0.005364276003092527,
+      "eval_runtime": 316.4189,
+      "eval_samples_per_second": 7.989,
+      "eval_steps_per_second": 0.999,
+      "eval_wer": 1.0510284810126582,
+      "step": 1900
+    },
+    {
+      "epoch": 12.658227848101266,
+      "grad_norm": 0.34013208746910095,
+      "learning_rate": 5.983957219251336e-05,
+      "loss": 0.0295,
+      "step": 2000
+    },
+    {
+      "epoch": 12.658227848101266,
+      "eval_loss": 0.004200654104351997,
+      "eval_runtime": 316.6068,
+      "eval_samples_per_second": 7.985,
+      "eval_steps_per_second": 0.998,
+      "eval_wer": 1.0356012658227849,
+      "step": 2000
+    },
+    {
+      "epoch": 13.291139240506329,
+      "eval_loss": 0.003917561378329992,
+      "eval_runtime": 317.6825,
+      "eval_samples_per_second": 7.958,
+      "eval_steps_per_second": 0.995,
+      "eval_wer": 1.035996835443038,
+      "step": 2100
+    },
+    {
+      "epoch": 13.924050632911392,
+      "eval_loss": 0.0033297832123935223,
+      "eval_runtime": 317.8207,
+      "eval_samples_per_second": 7.954,
+      "eval_steps_per_second": 0.994,
+      "eval_wer": 1.0268987341772151,
+      "step": 2200
+    },
+    {
+      "epoch": 14.556962025316455,
+      "eval_loss": 0.0030845776200294495,
+      "eval_runtime": 316.4074,
+      "eval_samples_per_second": 7.99,
+      "eval_steps_per_second": 0.999,
+      "eval_wer": 1.0237341772151898,
+      "step": 2300
+    },
+    {
+      "epoch": 15.0,
+      "step": 2370,
+      "total_flos": 7.984243073297488e+18,
+      "train_loss": 0.8373936769831533,
+      "train_runtime": 15099.3203,
+      "train_samples_per_second": 2.511,
+      "train_steps_per_second": 0.157
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 2370,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
+  "save_steps": 400,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 7.984243073297488e+18,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}