End of training

Browse files

Files changed (5) hide show

README.md +3 -2
all_results.json +9 -9
eval_results.json +5 -5
train_results.json +5 -5
trainer_state.json +82 -547

README.md CHANGED Viewed

@@ -1,6 +1,7 @@
 ---
 base_model: microsoft/wavlm-base
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
@@ -16,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/wavlm-base](https://huggingface.co/microsoft/wavlm-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7129
-- Accuracy: 0.1026
 ## Model description

 ---
 base_model: microsoft/wavlm-base
 tags:
+- audio-classification
 - generated_from_trainer
 metrics:
 - accuracy
 This model is a fine-tuned version of [microsoft/wavlm-base](https://huggingface.co/microsoft/wavlm-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6534
+- Accuracy: 0.8974
 ## Model description

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 9.98,
     "eval_accuracy": 0.8974400257607471,
-    "eval_loss": 0.3295176029205322,
-    "eval_runtime": 499.4668,
-    "eval_samples_per_second": 49.741,
-    "eval_steps_per_second": 24.871,
-    "train_loss": 0.3321091743430706,
-    "train_runtime": 22869.426,
-    "train_samples_per_second": 11.098,
-    "train_steps_per_second": 0.173
 }

 {
+    "epoch": 9.91,
     "eval_accuracy": 0.8974400257607471,
+    "eval_loss": 0.6533961296081543,
+    "eval_runtime": 509.5539,
+    "eval_samples_per_second": 48.756,
+    "eval_steps_per_second": 24.378,
+    "train_loss": 0.4679390847659576,
+    "train_runtime": 4727.8199,
+    "train_samples_per_second": 10.914,
+    "train_steps_per_second": 0.169
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.98,
     "eval_accuracy": 0.8974400257607471,
-    "eval_loss": 0.3295176029205322,
-    "eval_runtime": 499.4668,
-    "eval_samples_per_second": 49.741,
-    "eval_steps_per_second": 24.871
 }

 {
+    "epoch": 9.91,
     "eval_accuracy": 0.8974400257607471,
+    "eval_loss": 0.6533961296081543,
+    "eval_runtime": 509.5539,
+    "eval_samples_per_second": 48.756,
+    "eval_steps_per_second": 24.378
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 9.98,
-    "train_loss": 0.3321091743430706,
-    "train_runtime": 22869.426,
-    "train_samples_per_second": 11.098,
-    "train_steps_per_second": 0.173
 }

 {
+    "epoch": 9.91,
+    "train_loss": 0.4679390847659576,
+    "train_runtime": 4727.8199,
+    "train_samples_per_second": 10.914,
+    "train_steps_per_second": 0.169
 }

trainer_state.json CHANGED Viewed

@@ -1,613 +1,148 @@
 {
   "best_metric": 0.8974400257607471,
-  "best_model_checkpoint": "/home/cloudwalker/ASVmodel/wavlm-base_3/checkpoint-100",
-  "epoch": 9.98109640831758,
   "eval_steps": 100,
-  "global_step": 3960,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.25,
-      "learning_rate": 7.575757575757576e-05,
-      "loss": 0.4161,
       "step": 100
     },
     {
-      "epoch": 0.25,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3295176029205322,
-      "eval_runtime": 497.7495,
-      "eval_samples_per_second": 49.913,
-      "eval_steps_per_second": 24.956,
       "step": 100
     },
     {
-      "epoch": 0.5,
-      "learning_rate": 0.00015151515151515152,
-      "loss": 0.3196,
       "step": 200
     },
     {
-      "epoch": 0.5,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3312481641769409,
-      "eval_runtime": 499.0539,
-      "eval_samples_per_second": 49.782,
-      "eval_steps_per_second": 24.891,
       "step": 200
     },
     {
-      "epoch": 0.76,
-      "learning_rate": 0.00022727272727272725,
-      "loss": 0.3391,
       "step": 300
     },
     {
-      "epoch": 0.76,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3353486657142639,
-      "eval_runtime": 499.0444,
-      "eval_samples_per_second": 49.783,
-      "eval_steps_per_second": 24.892,
       "step": 300
     },
     {
-      "epoch": 1.01,
-      "learning_rate": 0.00029966329966329963,
-      "loss": 0.3285,
       "step": 400
     },
     {
-      "epoch": 1.01,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3321685791015625,
-      "eval_runtime": 499.1271,
-      "eval_samples_per_second": 49.775,
-      "eval_steps_per_second": 24.887,
       "step": 400
     },
     {
-      "epoch": 1.26,
-      "learning_rate": 0.00029124579124579125,
-      "loss": 0.3354,
       "step": 500
     },
     {
-      "epoch": 1.26,
       "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3366284668445587,
-      "eval_runtime": 499.5555,
-      "eval_samples_per_second": 49.732,
-      "eval_steps_per_second": 24.866,
       "step": 500
     },
     {
-      "epoch": 1.51,
-      "learning_rate": 0.0002828282828282828,
-      "loss": 0.3344,
       "step": 600
     },
     {
-      "epoch": 1.51,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3315127491950989,
-      "eval_runtime": 499.6088,
-      "eval_samples_per_second": 49.727,
-      "eval_steps_per_second": 24.863,
       "step": 600
     },
     {
-      "epoch": 1.76,
-      "learning_rate": 0.0002744107744107744,
-      "loss": 0.3343,
       "step": 700
     },
     {
-      "epoch": 1.76,
       "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33083751797676086,
-      "eval_runtime": 499.431,
-      "eval_samples_per_second": 49.745,
-      "eval_steps_per_second": 24.872,
       "step": 700
     },
     {
-      "epoch": 2.02,
-      "learning_rate": 0.00026599326599326595,
-      "loss": 0.325,
       "step": 800
     },
     {
-      "epoch": 2.02,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33818838000297546,
-      "eval_runtime": 499.7312,
-      "eval_samples_per_second": 49.715,
-      "eval_steps_per_second": 24.857,
       "step": 800
     },
     {
-      "epoch": 2.27,
-      "learning_rate": 0.00025757575757575756,
-      "loss": 0.34,
-      "step": 900
-    },
-    {
-      "epoch": 2.27,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3314325511455536,
-      "eval_runtime": 499.9566,
-      "eval_samples_per_second": 49.692,
-      "eval_steps_per_second": 24.846,
-      "step": 900
-    },
-    {
-      "epoch": 2.52,
-      "learning_rate": 0.00024915824915824913,
-      "loss": 0.3333,
-      "step": 1000
-    },
-    {
-      "epoch": 2.52,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33876436948776245,
-      "eval_runtime": 499.9566,
-      "eval_samples_per_second": 49.692,
-      "eval_steps_per_second": 24.846,
-      "step": 1000
-    },
-    {
-      "epoch": 2.77,
-      "learning_rate": 0.00024074074074074072,
-      "loss": 0.318,
-      "step": 1100
-    },
-    {
-      "epoch": 2.77,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33707037568092346,
-      "eval_runtime": 499.5137,
-      "eval_samples_per_second": 49.736,
-      "eval_steps_per_second": 24.868,
-      "step": 1100
-    },
-    {
-      "epoch": 3.02,
-      "learning_rate": 0.0002323232323232323,
-      "loss": 0.3281,
-      "step": 1200
-    },
-    {
-      "epoch": 3.02,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33621686697006226,
-      "eval_runtime": 499.3401,
-      "eval_samples_per_second": 49.754,
-      "eval_steps_per_second": 24.877,
-      "step": 1200
-    },
-    {
-      "epoch": 3.28,
-      "learning_rate": 0.0002239057239057239,
-      "loss": 0.3293,
-      "step": 1300
-    },
-    {
-      "epoch": 3.28,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33068734407424927,
-      "eval_runtime": 499.4564,
-      "eval_samples_per_second": 49.742,
-      "eval_steps_per_second": 24.871,
-      "step": 1300
-    },
-    {
-      "epoch": 3.53,
-      "learning_rate": 0.00021548821548821544,
-      "loss": 0.3175,
-      "step": 1400
-    },
-    {
-      "epoch": 3.53,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33569779992103577,
-      "eval_runtime": 499.6949,
-      "eval_samples_per_second": 49.718,
-      "eval_steps_per_second": 24.859,
-      "step": 1400
-    },
-    {
-      "epoch": 3.78,
-      "learning_rate": 0.00020707070707070703,
-      "loss": 0.3415,
-      "step": 1500
-    },
-    {
-      "epoch": 3.78,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3321123421192169,
-      "eval_runtime": 499.567,
-      "eval_samples_per_second": 49.731,
-      "eval_steps_per_second": 24.866,
-      "step": 1500
-    },
-    {
-      "epoch": 4.03,
-      "learning_rate": 0.00019865319865319862,
-      "loss": 0.341,
-      "step": 1600
-    },
-    {
-      "epoch": 4.03,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33071625232696533,
-      "eval_runtime": 499.8939,
-      "eval_samples_per_second": 49.699,
-      "eval_steps_per_second": 24.849,
-      "step": 1600
-    },
-    {
-      "epoch": 4.28,
-      "learning_rate": 0.00019023569023569022,
-      "loss": 0.3285,
-      "step": 1700
-    },
-    {
-      "epoch": 4.28,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3307797610759735,
-      "eval_runtime": 500.1708,
-      "eval_samples_per_second": 49.671,
-      "eval_steps_per_second": 24.836,
-      "step": 1700
-    },
-    {
-      "epoch": 4.54,
-      "learning_rate": 0.0001818181818181818,
-      "loss": 0.3337,
-      "step": 1800
-    },
-    {
-      "epoch": 4.54,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.330828994512558,
-      "eval_runtime": 499.7725,
-      "eval_samples_per_second": 49.711,
-      "eval_steps_per_second": 24.855,
-      "step": 1800
-    },
-    {
-      "epoch": 4.79,
-      "learning_rate": 0.0001734006734006734,
-      "loss": 0.3276,
-      "step": 1900
-    },
-    {
-      "epoch": 4.79,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33070385456085205,
-      "eval_runtime": 499.7607,
-      "eval_samples_per_second": 49.712,
-      "eval_steps_per_second": 24.856,
-      "step": 1900
-    },
-    {
-      "epoch": 5.04,
-      "learning_rate": 0.000164983164983165,
-      "loss": 0.3248,
-      "step": 2000
-    },
-    {
-      "epoch": 5.04,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33109623193740845,
-      "eval_runtime": 500.0337,
-      "eval_samples_per_second": 49.685,
-      "eval_steps_per_second": 24.842,
-      "step": 2000
-    },
-    {
-      "epoch": 5.29,
-      "learning_rate": 0.00015656565656565653,
-      "loss": 0.3371,
-      "step": 2100
-    },
-    {
-      "epoch": 5.29,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3317299485206604,
-      "eval_runtime": 499.7678,
-      "eval_samples_per_second": 49.711,
-      "eval_steps_per_second": 24.856,
-      "step": 2100
-    },
-    {
-      "epoch": 5.55,
-      "learning_rate": 0.00014814814814814812,
-      "loss": 0.3261,
-      "step": 2200
-    },
-    {
-      "epoch": 5.55,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33148789405822754,
-      "eval_runtime": 499.916,
-      "eval_samples_per_second": 49.696,
-      "eval_steps_per_second": 24.848,
-      "step": 2200
-    },
-    {
-      "epoch": 5.8,
-      "learning_rate": 0.0001397306397306397,
-      "loss": 0.3277,
-      "step": 2300
-    },
-    {
-      "epoch": 5.8,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33226969838142395,
-      "eval_runtime": 500.0285,
-      "eval_samples_per_second": 49.685,
-      "eval_steps_per_second": 24.843,
-      "step": 2300
-    },
-    {
-      "epoch": 6.05,
-      "learning_rate": 0.0001313131313131313,
-      "loss": 0.3297,
-      "step": 2400
-    },
-    {
-      "epoch": 6.05,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33209508657455444,
-      "eval_runtime": 499.9688,
-      "eval_samples_per_second": 49.691,
-      "eval_steps_per_second": 24.846,
-      "step": 2400
-    },
-    {
-      "epoch": 6.3,
-      "learning_rate": 0.0001228956228956229,
-      "loss": 0.3397,
-      "step": 2500
-    },
-    {
-      "epoch": 6.3,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3315936028957367,
-      "eval_runtime": 500.0781,
-      "eval_samples_per_second": 49.68,
-      "eval_steps_per_second": 24.84,
-      "step": 2500
-    },
-    {
-      "epoch": 6.55,
-      "learning_rate": 0.00011447811447811446,
-      "loss": 0.3313,
-      "step": 2600
-    },
-    {
-      "epoch": 6.55,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3375791013240814,
-      "eval_runtime": 500.3761,
-      "eval_samples_per_second": 49.651,
-      "eval_steps_per_second": 24.825,
-      "step": 2600
-    },
-    {
-      "epoch": 6.81,
-      "learning_rate": 0.00010606060606060605,
-      "loss": 0.3297,
-      "step": 2700
-    },
-    {
-      "epoch": 6.81,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3325986862182617,
-      "eval_runtime": 499.9451,
-      "eval_samples_per_second": 49.693,
-      "eval_steps_per_second": 24.847,
-      "step": 2700
-    },
-    {
-      "epoch": 7.06,
-      "learning_rate": 9.764309764309764e-05,
-      "loss": 0.3148,
-      "step": 2800
-    },
-    {
-      "epoch": 7.06,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3326033651828766,
-      "eval_runtime": 500.102,
-      "eval_samples_per_second": 49.678,
-      "eval_steps_per_second": 24.839,
-      "step": 2800
-    },
-    {
-      "epoch": 7.31,
-      "learning_rate": 8.92255892255892e-05,
-      "loss": 0.33,
-      "step": 2900
-    },
-    {
-      "epoch": 7.31,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33067989349365234,
-      "eval_runtime": 499.6928,
-      "eval_samples_per_second": 49.719,
-      "eval_steps_per_second": 24.859,
-      "step": 2900
-    },
-    {
-      "epoch": 7.56,
-      "learning_rate": 8.08080808080808e-05,
-      "loss": 0.3373,
-      "step": 3000
-    },
-    {
-      "epoch": 7.56,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3357817232608795,
-      "eval_runtime": 499.6901,
-      "eval_samples_per_second": 49.719,
-      "eval_steps_per_second": 24.859,
-      "step": 3000
-    },
-    {
-      "epoch": 7.81,
-      "learning_rate": 7.239057239057239e-05,
-      "loss": 0.3229,
-      "step": 3100
-    },
-    {
-      "epoch": 7.81,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.331524521112442,
-      "eval_runtime": 499.59,
-      "eval_samples_per_second": 49.729,
-      "eval_steps_per_second": 24.864,
-      "step": 3100
-    },
-    {
-      "epoch": 8.07,
-      "learning_rate": 6.397306397306397e-05,
-      "loss": 0.3311,
-      "step": 3200
-    },
-    {
-      "epoch": 8.07,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.3329682946205139,
-      "eval_runtime": 499.5794,
-      "eval_samples_per_second": 49.73,
-      "eval_steps_per_second": 24.865,
-      "step": 3200
-    },
-    {
-      "epoch": 8.32,
-      "learning_rate": 5.5555555555555545e-05,
-      "loss": 0.32,
-      "step": 3300
-    },
-    {
-      "epoch": 8.32,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33294886350631714,
-      "eval_runtime": 500.087,
-      "eval_samples_per_second": 49.679,
-      "eval_steps_per_second": 24.84,
-      "step": 3300
-    },
-    {
-      "epoch": 8.57,
-      "learning_rate": 4.7138047138047136e-05,
-      "loss": 0.3303,
-      "step": 3400
-    },
-    {
-      "epoch": 8.57,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33330321311950684,
-      "eval_runtime": 499.642,
-      "eval_samples_per_second": 49.724,
-      "eval_steps_per_second": 24.862,
-      "step": 3400
-    },
-    {
-      "epoch": 8.82,
-      "learning_rate": 3.8720538720538714e-05,
-      "loss": 0.3268,
-      "step": 3500
-    },
-    {
-      "epoch": 8.82,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.332504540681839,
-      "eval_runtime": 499.7153,
-      "eval_samples_per_second": 49.716,
-      "eval_steps_per_second": 24.858,
-      "step": 3500
-    },
-    {
-      "epoch": 9.07,
-      "learning_rate": 3.03030303030303e-05,
-      "loss": 0.3362,
-      "step": 3600
-    },
-    {
-      "epoch": 9.07,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33143192529678345,
-      "eval_runtime": 499.7396,
-      "eval_samples_per_second": 49.714,
-      "eval_steps_per_second": 24.857,
-      "step": 3600
-    },
-    {
-      "epoch": 9.33,
-      "learning_rate": 2.1885521885521884e-05,
-      "loss": 0.3391,
-      "step": 3700
-    },
-    {
-      "epoch": 9.33,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33087798953056335,
-      "eval_runtime": 499.6009,
-      "eval_samples_per_second": 49.728,
-      "eval_steps_per_second": 24.864,
-      "step": 3700
-    },
-    {
-      "epoch": 9.58,
-      "learning_rate": 1.3468013468013465e-05,
-      "loss": 0.3233,
-      "step": 3800
-    },
-    {
-      "epoch": 9.58,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33190712332725525,
-      "eval_runtime": 499.6968,
-      "eval_samples_per_second": 49.718,
-      "eval_steps_per_second": 24.859,
-      "step": 3800
-    },
-    {
-      "epoch": 9.83,
-      "learning_rate": 5.05050505050505e-06,
-      "loss": 0.3196,
-      "step": 3900
-    },
-    {
-      "epoch": 9.83,
-      "eval_accuracy": 0.8974400257607471,
-      "eval_loss": 0.33247998356819153,
-      "eval_runtime": 499.604,
-      "eval_samples_per_second": 49.727,
-      "eval_steps_per_second": 24.864,
-      "step": 3900
-    },
-    {
-      "epoch": 9.98,
-      "step": 3960,
-      "total_flos": 1.506420070651024e+19,
-      "train_loss": 0.3321091743430706,
-      "train_runtime": 22869.426,
-      "train_samples_per_second": 11.098,
-      "train_steps_per_second": 0.173
     }
   ],
   "logging_steps": 100,
-  "max_steps": 3960,
   "num_train_epochs": 10,
   "save_steps": 100,
-  "total_flos": 1.506420070651024e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.8974400257607471,
+  "best_model_checkpoint": "/home/cloudwalker/ASVmodel/wavlm-base_3/checkpoint-500",
+  "epoch": 9.907120743034056,
   "eval_steps": 100,
+  "global_step": 800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.24,
+      "learning_rate": 0.00029166666666666664,
+      "loss": 0.2236,
       "step": 100
     },
     {
+      "epoch": 1.24,
+      "eval_accuracy": 0.4466672033488971,
+      "eval_loss": 12.849496841430664,
+      "eval_runtime": 506.1701,
+      "eval_samples_per_second": 49.082,
+      "eval_steps_per_second": 24.541,
       "step": 100
     },
     {
+      "epoch": 2.48,
+      "learning_rate": 0.00025,
+      "loss": 0.0514,
       "step": 200
     },
     {
+      "epoch": 2.48,
+      "eval_accuracy": 0.26771051360489456,
+      "eval_loss": 16.30784797668457,
+      "eval_runtime": 508.9091,
+      "eval_samples_per_second": 48.818,
+      "eval_steps_per_second": 24.409,
       "step": 200
     },
     {
+      "epoch": 3.72,
+      "learning_rate": 0.00020833333333333332,
+      "loss": 0.0,
       "step": 300
     },
     {
+      "epoch": 3.72,
+      "eval_accuracy": 0.25970053131540816,
+      "eval_loss": 17.56509017944336,
+      "eval_runtime": 508.9562,
+      "eval_samples_per_second": 48.814,
+      "eval_steps_per_second": 24.407,
       "step": 300
     },
     {
+      "epoch": 4.95,
+      "learning_rate": 0.00016666666666666666,
+      "loss": 0.3252,
       "step": 400
     },
     {
+      "epoch": 4.95,
+      "eval_accuracy": 0.1912332957655772,
+      "eval_loss": 15.03822135925293,
+      "eval_runtime": 508.9315,
+      "eval_samples_per_second": 48.816,
+      "eval_steps_per_second": 24.408,
       "step": 400
     },
     {
+      "epoch": 6.19,
+      "learning_rate": 0.000125,
+      "loss": 1.0577,
       "step": 500
     },
     {
+      "epoch": 6.19,
       "eval_accuracy": 0.8974400257607471,
+      "eval_loss": 0.6533961296081543,
+      "eval_runtime": 509.063,
+      "eval_samples_per_second": 48.803,
+      "eval_steps_per_second": 24.402,
       "step": 500
     },
     {
+      "epoch": 7.43,
+      "learning_rate": 8.333333333333333e-05,
+      "loss": 0.6973,
       "step": 600
     },
     {
+      "epoch": 7.43,
+      "eval_accuracy": 0.10255997423925294,
+      "eval_loss": 0.7351841926574707,
+      "eval_runtime": 509.1844,
+      "eval_samples_per_second": 48.792,
+      "eval_steps_per_second": 24.396,
       "step": 600
     },
     {
+      "epoch": 8.67,
+      "learning_rate": 4.1666666666666665e-05,
+      "loss": 0.6939,
       "step": 700
     },
     {
+      "epoch": 8.67,
       "eval_accuracy": 0.8974400257607471,
+      "eval_loss": 0.6210092902183533,
+      "eval_runtime": 509.3594,
+      "eval_samples_per_second": 48.775,
+      "eval_steps_per_second": 24.387,
       "step": 700
     },
     {
+      "epoch": 9.91,
+      "learning_rate": 0.0,
+      "loss": 0.6944,
       "step": 800
     },
     {
+      "epoch": 9.91,
+      "eval_accuracy": 0.10255997423925294,
+      "eval_loss": 0.7128772735595703,
+      "eval_runtime": 509.4575,
+      "eval_samples_per_second": 48.766,
+      "eval_steps_per_second": 24.383,
       "step": 800
     },
     {
+      "epoch": 9.91,
+      "step": 800,
+      "total_flos": 2.7192972653929354e+18,
+      "train_loss": 0.4679390847659576,
+      "train_runtime": 4727.8199,
+      "train_samples_per_second": 10.914,
+      "train_steps_per_second": 0.169
     }
   ],
   "logging_steps": 100,
+  "max_steps": 800,
   "num_train_epochs": 10,
   "save_steps": 100,
+  "total_flos": 2.7192972653929354e+18,
   "trial_name": null,
   "trial_params": null
 }