End of training

Browse files

Files changed (6) hide show

README.md +1 -1
all_results.json +8 -8
eval_results.json +4 -4
runs/Dec02_14-51-33_DESKTOP-SKBE9FB/events.out.tfevents.1733173007.DESKTOP-SKBE9FB.9660.1 +3 -0
train_results.json +4 -4
trainer_state.json +178 -178

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.1950
 - Accuracy: 0.4565
 ## Model description

 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.6895
 - Accuracy: 0.4565
 ## Model description

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 34.29,
     "eval_accuracy": 0.45652173913043476,
-    "eval_loss": 1.2148082256317139,
-    "eval_runtime": 0.9303,
-    "eval_samples_per_second": 49.446,
-    "eval_steps_per_second": 3.225,
-    "train_loss": 1.5571933190027873,
-    "train_runtime": 205.4869,
-    "train_samples_per_second": 41.462,
-    "train_steps_per_second": 0.584
 }

 {
     "epoch": 34.29,
     "eval_accuracy": 0.45652173913043476,
+    "eval_loss": 1.6895416975021362,
+    "eval_runtime": 0.9309,
+    "eval_samples_per_second": 49.413,
+    "eval_steps_per_second": 3.223,
+    "train_loss": 1.5655512491861978,
+    "train_runtime": 205.1989,
+    "train_samples_per_second": 41.521,
+    "train_steps_per_second": 0.585
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 34.29,
     "eval_accuracy": 0.45652173913043476,
-    "eval_loss": 1.2148082256317139,
-    "eval_runtime": 0.9303,
-    "eval_samples_per_second": 49.446,
-    "eval_steps_per_second": 3.225
 }

 {
     "epoch": 34.29,
     "eval_accuracy": 0.45652173913043476,
+    "eval_loss": 1.6895416975021362,
+    "eval_runtime": 0.9309,
+    "eval_samples_per_second": 49.413,
+    "eval_steps_per_second": 3.223
 }

runs/Dec02_14-51-33_DESKTOP-SKBE9FB/events.out.tfevents.1733173007.DESKTOP-SKBE9FB.9660.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a0c6e12c4fd31de7b9ccf3e724fcb483ad46dca2527ae0de746955e748bf43b
+size 405

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 34.29,
-    "train_loss": 1.5571933190027873,
-    "train_runtime": 205.4869,
-    "train_samples_per_second": 41.462,
-    "train_steps_per_second": 0.584
 }

 {
     "epoch": 34.29,
+    "train_loss": 1.5655512491861978,
+    "train_runtime": 205.1989,
+    "train_samples_per_second": 41.521,
+    "train_steps_per_second": 0.585
 }

trainer_state.json CHANGED Viewed

@@ -11,398 +11,398 @@
     {
       "epoch": 0.86,
       "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.683231353759766,
-      "eval_runtime": 0.7677,
-      "eval_samples_per_second": 59.919,
-      "eval_steps_per_second": 3.908,
       "step": 3
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2148082256317139,
-      "eval_runtime": 0.7682,
-      "eval_samples_per_second": 59.881,
-      "eval_steps_per_second": 3.905,
       "step": 7
     },
     {
       "epoch": 2.86,
-      "learning_rate": 0.0033333333333333335,
-      "loss": 4.4686,
       "step": 10
     },
     {
       "epoch": 2.86,
-      "eval_accuracy": 0.32608695652173914,
-      "eval_loss": 2.5061397552490234,
-      "eval_runtime": 0.8667,
-      "eval_samples_per_second": 53.075,
-      "eval_steps_per_second": 3.461,
       "step": 10
     },
     {
       "epoch": 4.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.4142353534698486,
-      "eval_runtime": 0.7492,
-      "eval_samples_per_second": 61.401,
-      "eval_steps_per_second": 4.004,
       "step": 14
     },
     {
       "epoch": 4.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.6117892265319824,
-      "eval_runtime": 0.8195,
-      "eval_samples_per_second": 56.133,
-      "eval_steps_per_second": 3.661,
       "step": 17
     },
     {
       "epoch": 5.71,
-      "learning_rate": 0.003703703703703704,
-      "loss": 1.7414,
       "step": 20
     },
     {
       "epoch": 6.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2483736276626587,
-      "eval_runtime": 0.7888,
-      "eval_samples_per_second": 58.319,
-      "eval_steps_per_second": 3.803,
       "step": 21
     },
     {
       "epoch": 6.86,
       "eval_accuracy": 0.32608695652173914,
-      "eval_loss": 1.3689510822296143,
-      "eval_runtime": 0.8157,
-      "eval_samples_per_second": 56.393,
-      "eval_steps_per_second": 3.678,
       "step": 24
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.4064823389053345,
-      "eval_runtime": 0.7631,
-      "eval_samples_per_second": 60.277,
-      "eval_steps_per_second": 3.931,
       "step": 28
     },
     {
       "epoch": 8.57,
-      "learning_rate": 0.0033333333333333335,
-      "loss": 1.3568,
       "step": 30
     },
     {
       "epoch": 8.86,
-      "eval_accuracy": 0.32608695652173914,
-      "eval_loss": 1.2682174444198608,
-      "eval_runtime": 0.8441,
-      "eval_samples_per_second": 54.498,
-      "eval_steps_per_second": 3.554,
       "step": 31
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2140024900436401,
-      "eval_runtime": 0.7452,
-      "eval_samples_per_second": 61.731,
-      "eval_steps_per_second": 4.026,
       "step": 35
     },
     {
       "epoch": 10.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2590564489364624,
-      "eval_runtime": 0.8142,
-      "eval_samples_per_second": 56.494,
-      "eval_steps_per_second": 3.684,
       "step": 38
     },
     {
       "epoch": 11.43,
-      "learning_rate": 0.002962962962962963,
-      "loss": 1.2275,
       "step": 40
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2518616914749146,
-      "eval_runtime": 0.7487,
-      "eval_samples_per_second": 61.44,
-      "eval_steps_per_second": 4.007,
       "step": 42
     },
     {
       "epoch": 12.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2184066772460938,
-      "eval_runtime": 0.8182,
-      "eval_samples_per_second": 56.219,
-      "eval_steps_per_second": 3.666,
       "step": 45
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2592365741729736,
-      "eval_runtime": 0.7547,
-      "eval_samples_per_second": 60.953,
-      "eval_steps_per_second": 3.975,
       "step": 49
     },
     {
       "epoch": 14.29,
-      "learning_rate": 0.0025925925925925925,
-      "loss": 1.3025,
       "step": 50
     },
     {
       "epoch": 14.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2246149778366089,
-      "eval_runtime": 0.7633,
-      "eval_samples_per_second": 60.267,
-      "eval_steps_per_second": 3.93,
       "step": 52
     },
     {
       "epoch": 16.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.3045893907546997,
-      "eval_runtime": 0.7571,
-      "eval_samples_per_second": 60.762,
-      "eval_steps_per_second": 3.963,
       "step": 56
     },
     {
       "epoch": 16.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2177391052246094,
-      "eval_runtime": 0.7723,
-      "eval_samples_per_second": 59.56,
-      "eval_steps_per_second": 3.884,
       "step": 59
     },
     {
       "epoch": 17.14,
-      "learning_rate": 0.0022222222222222222,
-      "loss": 1.2981,
       "step": 60
     },
     {
       "epoch": 18.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2338941097259521,
-      "eval_runtime": 0.7731,
-      "eval_samples_per_second": 59.498,
-      "eval_steps_per_second": 3.88,
       "step": 63
     },
     {
       "epoch": 18.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.313918113708496,
-      "eval_runtime": 0.7563,
-      "eval_samples_per_second": 60.821,
-      "eval_steps_per_second": 3.967,
       "step": 66
     },
     {
       "epoch": 20.0,
-      "learning_rate": 0.001851851851851852,
-      "loss": 1.2765,
       "step": 70
     },
     {
       "epoch": 20.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2116084098815918,
-      "eval_runtime": 0.7487,
-      "eval_samples_per_second": 61.441,
-      "eval_steps_per_second": 4.007,
       "step": 70
     },
     {
       "epoch": 20.86,
-      "eval_accuracy": 0.32608695652173914,
-      "eval_loss": 1.2283920049667358,
-      "eval_runtime": 0.8009,
-      "eval_samples_per_second": 57.432,
-      "eval_steps_per_second": 3.746,
       "step": 73
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2246237993240356,
-      "eval_runtime": 0.7673,
-      "eval_samples_per_second": 59.952,
-      "eval_steps_per_second": 3.91,
       "step": 77
     },
     {
       "epoch": 22.86,
-      "learning_rate": 0.0014814814814814814,
-      "loss": 1.2074,
       "step": 80
     },
     {
       "epoch": 22.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2630535364151,
-      "eval_runtime": 0.7811,
-      "eval_samples_per_second": 58.89,
-      "eval_steps_per_second": 3.841,
       "step": 80
     },
     {
       "epoch": 24.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2092362642288208,
-      "eval_runtime": 0.769,
-      "eval_samples_per_second": 59.821,
-      "eval_steps_per_second": 3.901,
       "step": 84
     },
     {
       "epoch": 24.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2146543264389038,
-      "eval_runtime": 0.7867,
-      "eval_samples_per_second": 58.472,
-      "eval_steps_per_second": 3.813,
       "step": 87
     },
     {
       "epoch": 25.71,
-      "learning_rate": 0.0011111111111111111,
-      "loss": 1.2048,
       "step": 90
     },
     {
       "epoch": 26.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2120637893676758,
-      "eval_runtime": 0.8352,
-      "eval_samples_per_second": 55.077,
-      "eval_steps_per_second": 3.592,
       "step": 91
     },
     {
       "epoch": 26.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.215645432472229,
-      "eval_runtime": 0.7342,
-      "eval_samples_per_second": 62.656,
-      "eval_steps_per_second": 4.086,
       "step": 94
     },
     {
       "epoch": 28.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2249161005020142,
-      "eval_runtime": 0.8011,
-      "eval_samples_per_second": 57.422,
-      "eval_steps_per_second": 3.745,
       "step": 98
     },
     {
       "epoch": 28.57,
-      "learning_rate": 0.0007407407407407407,
-      "loss": 1.2068,
       "step": 100
     },
     {
       "epoch": 28.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2159205675125122,
-      "eval_runtime": 0.7602,
-      "eval_samples_per_second": 60.509,
-      "eval_steps_per_second": 3.946,
       "step": 101
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.210811972618103,
-      "eval_runtime": 0.795,
-      "eval_samples_per_second": 57.858,
-      "eval_steps_per_second": 3.773,
       "step": 105
     },
     {
       "epoch": 30.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2115787267684937,
-      "eval_runtime": 0.7682,
-      "eval_samples_per_second": 59.882,
-      "eval_steps_per_second": 3.905,
       "step": 108
     },
     {
       "epoch": 31.43,
-      "learning_rate": 0.00037037037037037035,
-      "loss": 1.1961,
       "step": 110
     },
     {
       "epoch": 32.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2078149318695068,
-      "eval_runtime": 0.8022,
-      "eval_samples_per_second": 57.342,
-      "eval_steps_per_second": 3.74,
       "step": 112
     },
     {
       "epoch": 32.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2069722414016724,
-      "eval_runtime": 0.8538,
-      "eval_samples_per_second": 53.877,
-      "eval_steps_per_second": 3.514,
       "step": 115
     },
     {
       "epoch": 34.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2071927785873413,
-      "eval_runtime": 0.77,
-      "eval_samples_per_second": 59.74,
-      "eval_steps_per_second": 3.896,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
-      "loss": 1.1999,
       "step": 120
     },
     {
       "epoch": 34.29,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.207156777381897,
-      "eval_runtime": 0.7739,
-      "eval_samples_per_second": 59.437,
-      "eval_steps_per_second": 3.876,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
-      "train_loss": 1.5571933190027873,
-      "train_runtime": 205.4869,
-      "train_samples_per_second": 41.462,
-      "train_steps_per_second": 0.584
     }
   ],
   "logging_steps": 10,

     {
       "epoch": 0.86,
       "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 7.501729488372803,
+      "eval_runtime": 0.7613,
+      "eval_samples_per_second": 60.421,
+      "eval_steps_per_second": 3.941,
       "step": 3
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.6895416975021362,
+      "eval_runtime": 0.7697,
+      "eval_samples_per_second": 59.762,
+      "eval_steps_per_second": 3.898,
       "step": 7
     },
     {
       "epoch": 2.86,
+      "learning_rate": 0.0016666666666666668,
+      "loss": 4.88,
       "step": 10
     },
     {
       "epoch": 2.86,
+      "eval_accuracy": 0.10869565217391304,
+      "eval_loss": 4.138199329376221,
+      "eval_runtime": 0.7697,
+      "eval_samples_per_second": 59.76,
+      "eval_steps_per_second": 3.897,
       "step": 10
     },
     {
       "epoch": 4.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.5189474821090698,
+      "eval_runtime": 0.7775,
+      "eval_samples_per_second": 59.16,
+      "eval_steps_per_second": 3.858,
       "step": 14
     },
     {
       "epoch": 4.86,
+      "eval_accuracy": 0.32608695652173914,
+      "eval_loss": 1.4063533544540405,
+      "eval_runtime": 0.8154,
+      "eval_samples_per_second": 56.416,
+      "eval_steps_per_second": 3.679,
       "step": 17
     },
     {
       "epoch": 5.71,
+      "learning_rate": 0.001851851851851852,
+      "loss": 1.7482,
       "step": 20
     },
     {
       "epoch": 6.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.3558485507965088,
+      "eval_runtime": 0.8427,
+      "eval_samples_per_second": 54.584,
+      "eval_steps_per_second": 3.56,
       "step": 21
     },
     {
       "epoch": 6.86,
       "eval_accuracy": 0.32608695652173914,
+      "eval_loss": 1.3179720640182495,
+      "eval_runtime": 0.8639,
+      "eval_samples_per_second": 53.247,
+      "eval_steps_per_second": 3.473,
       "step": 24
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.32608695652173914,
+      "eval_loss": 1.2377893924713135,
+      "eval_runtime": 0.7959,
+      "eval_samples_per_second": 57.795,
+      "eval_steps_per_second": 3.769,
       "step": 28
     },
     {
       "epoch": 8.57,
+      "learning_rate": 0.0016666666666666668,
+      "loss": 1.3281,
       "step": 30
     },
     {
       "epoch": 8.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.338990569114685,
+      "eval_runtime": 0.9078,
+      "eval_samples_per_second": 50.675,
+      "eval_steps_per_second": 3.305,
       "step": 31
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2144430875778198,
+      "eval_runtime": 1.1213,
+      "eval_samples_per_second": 41.024,
+      "eval_steps_per_second": 2.675,
       "step": 35
     },
     {
       "epoch": 10.86,
+      "eval_accuracy": 0.32608695652173914,
+      "eval_loss": 1.2492074966430664,
+      "eval_runtime": 0.8022,
+      "eval_samples_per_second": 57.343,
+      "eval_steps_per_second": 3.74,
       "step": 38
     },
     {
       "epoch": 11.43,
+      "learning_rate": 0.0014814814814814814,
+      "loss": 1.2367,
       "step": 40
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2685078382492065,
+      "eval_runtime": 0.7767,
+      "eval_samples_per_second": 59.225,
+      "eval_steps_per_second": 3.862,
       "step": 42
     },
     {
       "epoch": 12.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.239018440246582,
+      "eval_runtime": 0.8102,
+      "eval_samples_per_second": 56.778,
+      "eval_steps_per_second": 3.703,
       "step": 45
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.32608695652173914,
+      "eval_loss": 1.2648324966430664,
+      "eval_runtime": 0.7642,
+      "eval_samples_per_second": 60.192,
+      "eval_steps_per_second": 3.926,
       "step": 49
     },
     {
       "epoch": 14.29,
+      "learning_rate": 0.0012962962962962963,
+      "loss": 1.2707,
       "step": 50
     },
     {
       "epoch": 14.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2209372520446777,
+      "eval_runtime": 1.1243,
+      "eval_samples_per_second": 40.916,
+      "eval_steps_per_second": 2.668,
       "step": 52
     },
     {
       "epoch": 16.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2627573013305664,
+      "eval_runtime": 0.7265,
+      "eval_samples_per_second": 63.313,
+      "eval_steps_per_second": 4.129,
       "step": 56
     },
     {
       "epoch": 16.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2172560691833496,
+      "eval_runtime": 0.7692,
+      "eval_samples_per_second": 59.804,
+      "eval_steps_per_second": 3.9,
       "step": 59
     },
     {
       "epoch": 17.14,
+      "learning_rate": 0.0011111111111111111,
+      "loss": 1.2699,
       "step": 60
     },
     {
       "epoch": 18.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2144685983657837,
+      "eval_runtime": 0.7427,
+      "eval_samples_per_second": 61.937,
+      "eval_steps_per_second": 4.039,
       "step": 63
     },
     {
       "epoch": 18.86,
+      "eval_accuracy": 0.43478260869565216,
+      "eval_loss": 1.233435869216919,
+      "eval_runtime": 0.8122,
+      "eval_samples_per_second": 56.636,
+      "eval_steps_per_second": 3.694,
       "step": 66
     },
     {
       "epoch": 20.0,
+      "learning_rate": 0.000925925925925926,
+      "loss": 1.2509,
       "step": 70
     },
     {
       "epoch": 20.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2693239450454712,
+      "eval_runtime": 0.7922,
+      "eval_samples_per_second": 58.066,
+      "eval_steps_per_second": 3.787,
       "step": 70
     },
     {
       "epoch": 20.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2040687799453735,
+      "eval_runtime": 0.7802,
+      "eval_samples_per_second": 58.961,
+      "eval_steps_per_second": 3.845,
       "step": 73
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.3695652173913043,
+      "eval_loss": 1.230669379234314,
+      "eval_runtime": 0.7355,
+      "eval_samples_per_second": 62.546,
+      "eval_steps_per_second": 4.079,
       "step": 77
     },
     {
       "epoch": 22.86,
+      "learning_rate": 0.0007407407407407407,
+      "loss": 1.1936,
       "step": 80
     },
     {
       "epoch": 22.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.21720552444458,
+      "eval_runtime": 1.1738,
+      "eval_samples_per_second": 39.19,
+      "eval_steps_per_second": 2.556,
       "step": 80
     },
     {
       "epoch": 24.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.210868000984192,
+      "eval_runtime": 0.7282,
+      "eval_samples_per_second": 63.171,
+      "eval_steps_per_second": 4.12,
       "step": 84
     },
     {
       "epoch": 24.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.205082893371582,
+      "eval_runtime": 0.7492,
+      "eval_samples_per_second": 61.4,
+      "eval_steps_per_second": 4.004,
       "step": 87
     },
     {
       "epoch": 25.71,
+      "learning_rate": 0.0005555555555555556,
+      "loss": 1.1629,
       "step": 90
     },
     {
       "epoch": 26.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2083849906921387,
+      "eval_runtime": 0.7267,
+      "eval_samples_per_second": 63.298,
+      "eval_steps_per_second": 4.128,
       "step": 91
     },
     {
       "epoch": 26.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2217854261398315,
+      "eval_runtime": 0.7642,
+      "eval_samples_per_second": 60.195,
+      "eval_steps_per_second": 3.926,
       "step": 94
     },
     {
       "epoch": 28.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.229410171508789,
+      "eval_runtime": 0.9487,
+      "eval_samples_per_second": 48.486,
+      "eval_steps_per_second": 3.162,
       "step": 98
     },
     {
       "epoch": 28.57,
+      "learning_rate": 0.00037037037037037035,
+      "loss": 1.1606,
       "step": 100
     },
     {
       "epoch": 28.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2059509754180908,
+      "eval_runtime": 0.7608,
+      "eval_samples_per_second": 60.46,
+      "eval_steps_per_second": 3.943,
       "step": 101
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.41304347826086957,
+      "eval_loss": 1.2063390016555786,
+      "eval_runtime": 0.7622,
+      "eval_samples_per_second": 60.353,
+      "eval_steps_per_second": 3.936,
       "step": 105
     },
     {
       "epoch": 30.86,
+      "eval_accuracy": 0.41304347826086957,
+      "eval_loss": 1.2118929624557495,
+      "eval_runtime": 0.7777,
+      "eval_samples_per_second": 59.146,
+      "eval_steps_per_second": 3.857,
       "step": 108
     },
     {
       "epoch": 31.43,
+      "learning_rate": 0.00018518518518518518,
+      "loss": 1.1525,
       "step": 110
     },
     {
       "epoch": 32.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.2072707414627075,
+      "eval_runtime": 0.7829,
+      "eval_samples_per_second": 58.755,
+      "eval_steps_per_second": 3.832,
       "step": 112
     },
     {
       "epoch": 32.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.1994774341583252,
+      "eval_runtime": 0.9102,
+      "eval_samples_per_second": 50.537,
+      "eval_steps_per_second": 3.296,
       "step": 115
     },
     {
       "epoch": 34.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.1953673362731934,
+      "eval_runtime": 0.7781,
+      "eval_samples_per_second": 59.118,
+      "eval_steps_per_second": 3.856,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
+      "loss": 1.1326,
       "step": 120
     },
     {
       "epoch": 34.29,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.195010781288147,
+      "eval_runtime": 0.7669,
+      "eval_samples_per_second": 59.984,
+      "eval_steps_per_second": 3.912,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
+      "train_loss": 1.5655512491861978,
+      "train_runtime": 205.1989,
+      "train_samples_per_second": 41.521,
+      "train_steps_per_second": 0.585
     }
   ],
   "logging_steps": 10,