Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +232 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +670 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,232 @@

+{
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "iot_wemo_off",
+    "1": "qa_maths",
+    "10": "alarm_remove",
+    "11": "qa_stock",
+    "12": "email_sendemail",
+    "13": "music_settings",
+    "14": "transport_taxi",
+    "15": "iot_hue_lightoff",
+    "16": "email_querycontact",
+    "17": "audio_volume_other",
+    "18": "play_audiobook",
+    "19": "calendar_query",
+    "2": "recommendation_movies",
+    "20": "iot_wemo_on",
+    "21": "datetime_convert",
+    "22": "music_likeness",
+    "23": "cooking_query",
+    "24": "play_podcasts",
+    "25": "lists_createoradd",
+    "26": "lists_query",
+    "27": "iot_cleaning",
+    "28": "cooking_recipe",
+    "29": "audio_volume_mute",
+    "3": "audio_volume_up",
+    "30": "qa_currency",
+    "31": "email_query",
+    "32": "qa_definition",
+    "33": "iot_hue_lighton",
+    "34": "calendar_remove",
+    "35": "iot_coffee",
+    "36": "calendar_set",
+    "37": "general_joke",
+    "38": "takeaway_order",
+    "39": "iot_hue_lightchange",
+    "4": "general_greet",
+    "40": "recommendation_events",
+    "41": "iot_hue_lightdim",
+    "42": "datetime_query",
+    "43": "music_dislikeness",
+    "44": "transport_traffic",
+    "45": "general_quirky",
+    "46": "qa_factoid",
+    "47": "alarm_query",
+    "48": "weather_query",
+    "49": "social_query",
+    "5": "iot_hue_lightup",
+    "50": "transport_query",
+    "51": "play_music",
+    "52": "news_query",
+    "53": "social_post",
+    "54": "lists_remove",
+    "55": "play_game",
+    "56": "alarm_set",
+    "57": "transport_ticket",
+    "58": "takeaway_query",
+    "59": "music_query",
+    "6": "email_addcontact",
+    "7": "play_radio",
+    "8": "audio_volume_down",
+    "9": "recommendation_locations"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "alarm_query": "47",
+    "alarm_remove": "10",
+    "alarm_set": "56",
+    "audio_volume_down": "8",
+    "audio_volume_mute": "29",
+    "audio_volume_other": "17",
+    "audio_volume_up": "3",
+    "calendar_query": "19",
+    "calendar_remove": "34",
+    "calendar_set": "36",
+    "cooking_query": "23",
+    "cooking_recipe": "28",
+    "datetime_convert": "21",
+    "datetime_query": "42",
+    "email_addcontact": "6",
+    "email_query": "31",
+    "email_querycontact": "16",
+    "email_sendemail": "12",
+    "general_greet": "4",
+    "general_joke": "37",
+    "general_quirky": "45",
+    "iot_cleaning": "27",
+    "iot_coffee": "35",
+    "iot_hue_lightchange": "39",
+    "iot_hue_lightdim": "41",
+    "iot_hue_lightoff": "15",
+    "iot_hue_lighton": "33",
+    "iot_hue_lightup": "5",
+    "iot_wemo_off": "0",
+    "iot_wemo_on": "20",
+    "lists_createoradd": "25",
+    "lists_query": "26",
+    "lists_remove": "54",
+    "music_dislikeness": "43",
+    "music_likeness": "22",
+    "music_query": "59",
+    "music_settings": "13",
+    "news_query": "52",
+    "play_audiobook": "18",
+    "play_game": "55",
+    "play_music": "51",
+    "play_podcasts": "24",
+    "play_radio": "7",
+    "qa_currency": "30",
+    "qa_definition": "32",
+    "qa_factoid": "46",
+    "qa_maths": "1",
+    "qa_stock": "11",
+    "recommendation_events": "40",
+    "recommendation_locations": "9",
+    "recommendation_movies": "2",
+    "social_post": "53",
+    "social_query": "49",
+    "takeaway_order": "38",
+    "takeaway_query": "58",
+    "transport_query": "50",
+    "transport_taxi": "14",
+    "transport_ticket": "57",
+    "transport_traffic": "44",
+    "weather_query": "48"
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.075,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 0,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.0.dev0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5b0528a58a33b3e7f9f625a688f3120b1b219ee9cfbdf5ef998a6ee0069a93d3
+size 2525980249

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2001393616260a2451f54ce8eed437122326c6efcd9eccabb0a896fface9316f
+size 1263010605

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1cb8ac73d9152bed148974deef5c1ab92db946fbb30d44e16d7dc628aea3849d
+size 14567

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:093366c8f46dc68efc47501492eaa2b2aac2f9563b6eb039428d08ced56a2d70
+size 559

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82e44ac207bea40c1c5d082a1a24bbc7b8e0a079cb4ee6a13288dd13795b56b0
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,670 @@

+{
+  "best_metric": 0.8040629095674967,
+  "best_model_checkpoint": "wav2vec2-xls-r-300m-ic-finetuning/checkpoint-2675",
+  "epoch": 29.995348837209303,
+  "global_step": 3210,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.47,
+      "learning_rate": 1.5264797507788163e-05,
+      "loss": 4.0833,
+      "step": 50
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.08411214953271e-05,
+      "loss": 4.013,
+      "step": 100
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.06946264744429882,
+      "eval_loss": 3.8936545848846436,
+      "eval_runtime": 23.3839,
+      "eval_samples_per_second": 65.259,
+      "eval_steps_per_second": 2.053,
+      "step": 107
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 4.641744548286604e-05,
+      "loss": 3.8855,
+      "step": 150
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 6.199376947040498e-05,
+      "loss": 3.7509,
+      "step": 200
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.06946264744429882,
+      "eval_loss": 3.778992176055908,
+      "eval_runtime": 23.2928,
+      "eval_samples_per_second": 65.514,
+      "eval_steps_per_second": 2.061,
+      "step": 214
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 7.757009345794393e-05,
+      "loss": 3.7888,
+      "step": 250
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 9.314641744548286e-05,
+      "loss": 3.7477,
+      "step": 300
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.06422018348623854,
+      "eval_loss": 3.760488748550415,
+      "eval_runtime": 23.2905,
+      "eval_samples_per_second": 65.52,
+      "eval_steps_per_second": 2.061,
+      "step": 321
+    },
+    {
+      "epoch": 3.27,
+      "learning_rate": 9.903080650744203e-05,
+      "loss": 3.7551,
+      "step": 350
+    },
+    {
+      "epoch": 3.73,
+      "learning_rate": 9.730010384215992e-05,
+      "loss": 3.7013,
+      "step": 400
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.10288335517693316,
+      "eval_loss": 3.6565122604370117,
+      "eval_runtime": 23.3565,
+      "eval_samples_per_second": 65.335,
+      "eval_steps_per_second": 2.055,
+      "step": 428
+    },
+    {
+      "epoch": 4.2,
+      "learning_rate": 9.556940117687782e-05,
+      "loss": 3.7122,
+      "step": 450
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 9.383869851159571e-05,
+      "loss": 3.5953,
+      "step": 500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.12647444298820446,
+      "eval_loss": 3.4294865131378174,
+      "eval_runtime": 23.3639,
+      "eval_samples_per_second": 65.315,
+      "eval_steps_per_second": 2.054,
+      "step": 535
+    },
+    {
+      "epoch": 5.14,
+      "learning_rate": 9.21079958463136e-05,
+      "loss": 3.5112,
+      "step": 550
+    },
+    {
+      "epoch": 5.6,
+      "learning_rate": 9.041190723433715e-05,
+      "loss": 3.35,
+      "step": 600
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.19855832241153343,
+      "eval_loss": 3.083688974380493,
+      "eval_runtime": 23.4304,
+      "eval_samples_per_second": 65.129,
+      "eval_steps_per_second": 2.049,
+      "step": 642
+    },
+    {
+      "epoch": 6.07,
+      "learning_rate": 8.868120456905504e-05,
+      "loss": 3.2423,
+      "step": 650
+    },
+    {
+      "epoch": 6.54,
+      "learning_rate": 8.695050190377294e-05,
+      "loss": 2.9948,
+      "step": 700
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.32044560943643513,
+      "eval_loss": 2.5826685428619385,
+      "eval_runtime": 23.3418,
+      "eval_samples_per_second": 65.376,
+      "eval_steps_per_second": 2.056,
+      "step": 749
+    },
+    {
+      "epoch": 7.01,
+      "learning_rate": 8.521979923849083e-05,
+      "loss": 2.8101,
+      "step": 750
+    },
+    {
+      "epoch": 7.47,
+      "learning_rate": 8.352371062651437e-05,
+      "loss": 2.5137,
+      "step": 800
+    },
+    {
+      "epoch": 7.94,
+      "learning_rate": 8.179300796123225e-05,
+      "loss": 2.3776,
+      "step": 850
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.4619921363040629,
+      "eval_loss": 2.1507654190063477,
+      "eval_runtime": 23.378,
+      "eval_samples_per_second": 65.275,
+      "eval_steps_per_second": 2.053,
+      "step": 856
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 8.006230529595016e-05,
+      "loss": 2.1621,
+      "step": 900
+    },
+    {
+      "epoch": 8.87,
+      "learning_rate": 7.833160263066806e-05,
+      "loss": 2.0058,
+      "step": 950
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.528178243774574,
+      "eval_loss": 1.857922911643982,
+      "eval_runtime": 23.3965,
+      "eval_samples_per_second": 65.223,
+      "eval_steps_per_second": 2.052,
+      "step": 963
+    },
+    {
+      "epoch": 9.34,
+      "learning_rate": 7.660089996538595e-05,
+      "loss": 1.8365,
+      "step": 1000
+    },
+    {
+      "epoch": 9.81,
+      "learning_rate": 7.487019730010385e-05,
+      "loss": 1.683,
+      "step": 1050
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.6133682830930537,
+      "eval_loss": 1.5978834629058838,
+      "eval_runtime": 23.2913,
+      "eval_samples_per_second": 65.518,
+      "eval_steps_per_second": 2.061,
+      "step": 1070
+    },
+    {
+      "epoch": 10.28,
+      "learning_rate": 7.313949463482174e-05,
+      "loss": 1.5977,
+      "step": 1100
+    },
+    {
+      "epoch": 10.74,
+      "learning_rate": 7.140879196953964e-05,
+      "loss": 1.4444,
+      "step": 1150
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.663826998689384,
+      "eval_loss": 1.4753053188323975,
+      "eval_runtime": 23.3735,
+      "eval_samples_per_second": 65.288,
+      "eval_steps_per_second": 2.054,
+      "step": 1177
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 6.967808930425753e-05,
+      "loss": 1.3652,
+      "step": 1200
+    },
+    {
+      "epoch": 11.68,
+      "learning_rate": 6.794738663897543e-05,
+      "loss": 1.232,
+      "step": 1250
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.6933158584534731,
+      "eval_loss": 1.316873550415039,
+      "eval_runtime": 23.4493,
+      "eval_samples_per_second": 65.077,
+      "eval_steps_per_second": 2.047,
+      "step": 1284
+    },
+    {
+      "epoch": 12.15,
+      "learning_rate": 6.621668397369333e-05,
+      "loss": 1.2344,
+      "step": 1300
+    },
+    {
+      "epoch": 12.61,
+      "learning_rate": 6.448598130841122e-05,
+      "loss": 1.0976,
+      "step": 1350
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.7319790301441678,
+      "eval_loss": 1.229066252708435,
+      "eval_runtime": 23.3919,
+      "eval_samples_per_second": 65.236,
+      "eval_steps_per_second": 2.052,
+      "step": 1391
+    },
+    {
+      "epoch": 13.08,
+      "learning_rate": 6.275527864312911e-05,
+      "loss": 1.0488,
+      "step": 1400
+    },
+    {
+      "epoch": 13.55,
+      "learning_rate": 6.102457597784701e-05,
+      "loss": 0.9466,
+      "step": 1450
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.744429882044561,
+      "eval_loss": 1.184418797492981,
+      "eval_runtime": 23.4293,
+      "eval_samples_per_second": 65.132,
+      "eval_steps_per_second": 2.049,
+      "step": 1498
+    },
+    {
+      "epoch": 14.02,
+      "learning_rate": 5.9293873312564906e-05,
+      "loss": 0.9305,
+      "step": 1500
+    },
+    {
+      "epoch": 14.48,
+      "learning_rate": 5.756317064728281e-05,
+      "loss": 0.833,
+      "step": 1550
+    },
+    {
+      "epoch": 14.95,
+      "learning_rate": 5.583246798200069e-05,
+      "loss": 0.839,
+      "step": 1600
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.755570117955439,
+      "eval_loss": 1.1289950609207153,
+      "eval_runtime": 23.407,
+      "eval_samples_per_second": 65.194,
+      "eval_steps_per_second": 2.051,
+      "step": 1605
+    },
+    {
+      "epoch": 15.42,
+      "learning_rate": 5.410176531671859e-05,
+      "loss": 0.7683,
+      "step": 1650
+    },
+    {
+      "epoch": 15.88,
+      "learning_rate": 5.2371062651436485e-05,
+      "loss": 0.6801,
+      "step": 1700
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.7693315858453473,
+      "eval_loss": 1.125131368637085,
+      "eval_runtime": 23.6242,
+      "eval_samples_per_second": 64.595,
+      "eval_steps_per_second": 2.032,
+      "step": 1712
+    },
+    {
+      "epoch": 16.35,
+      "learning_rate": 5.064035998615439e-05,
+      "loss": 0.6717,
+      "step": 1750
+    },
+    {
+      "epoch": 16.82,
+      "learning_rate": 4.8909657320872275e-05,
+      "loss": 0.6781,
+      "step": 1800
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.7745740498034076,
+      "eval_loss": 1.1027562618255615,
+      "eval_runtime": 23.455,
+      "eval_samples_per_second": 65.061,
+      "eval_steps_per_second": 2.046,
+      "step": 1819
+    },
+    {
+      "epoch": 17.29,
+      "learning_rate": 4.7178954655590177e-05,
+      "loss": 0.6023,
+      "step": 1850
+    },
+    {
+      "epoch": 17.75,
+      "learning_rate": 4.5448251990308065e-05,
+      "loss": 0.5996,
+      "step": 1900
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.7804718217562254,
+      "eval_loss": 1.0976942777633667,
+      "eval_runtime": 23.4288,
+      "eval_samples_per_second": 65.134,
+      "eval_steps_per_second": 2.049,
+      "step": 1926
+    },
+    {
+      "epoch": 18.22,
+      "learning_rate": 4.3717549325025966e-05,
+      "loss": 0.5499,
+      "step": 1950
+    },
+    {
+      "epoch": 18.69,
+      "learning_rate": 4.1986846659743854e-05,
+      "loss": 0.5165,
+      "step": 2000
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.783748361730013,
+      "eval_loss": 1.117361068725586,
+      "eval_runtime": 23.3249,
+      "eval_samples_per_second": 65.424,
+      "eval_steps_per_second": 2.058,
+      "step": 2033
+    },
+    {
+      "epoch": 19.16,
+      "learning_rate": 4.0256143994461756e-05,
+      "loss": 0.5191,
+      "step": 2050
+    },
+    {
+      "epoch": 19.62,
+      "learning_rate": 3.852544132917965e-05,
+      "loss": 0.4555,
+      "step": 2100
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.7883355176933159,
+      "eval_loss": 1.0993103981018066,
+      "eval_runtime": 23.3454,
+      "eval_samples_per_second": 65.366,
+      "eval_steps_per_second": 2.056,
+      "step": 2140
+    },
+    {
+      "epoch": 20.09,
+      "learning_rate": 3.6794738663897545e-05,
+      "loss": 0.4704,
+      "step": 2150
+    },
+    {
+      "epoch": 20.56,
+      "learning_rate": 3.506403599861544e-05,
+      "loss": 0.4406,
+      "step": 2200
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.7942332896461337,
+      "eval_loss": 1.0940536260604858,
+      "eval_runtime": 23.3681,
+      "eval_samples_per_second": 65.303,
+      "eval_steps_per_second": 2.054,
+      "step": 2247
+    },
+    {
+      "epoch": 21.03,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.4113,
+      "step": 2250
+    },
+    {
+      "epoch": 21.49,
+      "learning_rate": 3.160263066805123e-05,
+      "loss": 0.3725,
+      "step": 2300
+    },
+    {
+      "epoch": 21.96,
+      "learning_rate": 2.9871928002769128e-05,
+      "loss": 0.3822,
+      "step": 2350
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.7889908256880734,
+      "eval_loss": 1.0881223678588867,
+      "eval_runtime": 23.2822,
+      "eval_samples_per_second": 65.544,
+      "eval_steps_per_second": 2.062,
+      "step": 2354
+    },
+    {
+      "epoch": 22.43,
+      "learning_rate": 2.814122533748702e-05,
+      "loss": 0.3608,
+      "step": 2400
+    },
+    {
+      "epoch": 22.89,
+      "learning_rate": 2.6410522672204917e-05,
+      "loss": 0.3348,
+      "step": 2450
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.8027522935779816,
+      "eval_loss": 1.1017186641693115,
+      "eval_runtime": 23.2012,
+      "eval_samples_per_second": 65.773,
+      "eval_steps_per_second": 2.069,
+      "step": 2461
+    },
+    {
+      "epoch": 23.36,
+      "learning_rate": 2.4679820006922812e-05,
+      "loss": 0.3675,
+      "step": 2500
+    },
+    {
+      "epoch": 23.83,
+      "learning_rate": 2.2949117341640707e-05,
+      "loss": 0.297,
+      "step": 2550
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.7981651376146789,
+      "eval_loss": 1.0910543203353882,
+      "eval_runtime": 23.2808,
+      "eval_samples_per_second": 65.547,
+      "eval_steps_per_second": 2.062,
+      "step": 2568
+    },
+    {
+      "epoch": 24.3,
+      "learning_rate": 2.1218414676358602e-05,
+      "loss": 0.2985,
+      "step": 2600
+    },
+    {
+      "epoch": 24.76,
+      "learning_rate": 1.9487712011076497e-05,
+      "loss": 0.2707,
+      "step": 2650
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.8040629095674967,
+      "eval_loss": 1.1111068725585938,
+      "eval_runtime": 23.5628,
+      "eval_samples_per_second": 64.763,
+      "eval_steps_per_second": 2.037,
+      "step": 2675
+    },
+    {
+      "epoch": 25.23,
+      "learning_rate": 1.775700934579439e-05,
+      "loss": 0.2748,
+      "step": 2700
+    },
+    {
+      "epoch": 25.7,
+      "learning_rate": 1.6026306680512286e-05,
+      "loss": 0.2834,
+      "step": 2750
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.7975098296199213,
+      "eval_loss": 1.1192971467971802,
+      "eval_runtime": 23.4535,
+      "eval_samples_per_second": 65.065,
+      "eval_steps_per_second": 2.047,
+      "step": 2782
+    },
+    {
+      "epoch": 26.17,
+      "learning_rate": 1.4295604015230184e-05,
+      "loss": 0.2589,
+      "step": 2800
+    },
+    {
+      "epoch": 26.63,
+      "learning_rate": 1.256490134994808e-05,
+      "loss": 0.2662,
+      "step": 2850
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.8034076015727392,
+      "eval_loss": 1.1238927841186523,
+      "eval_runtime": 23.4418,
+      "eval_samples_per_second": 65.097,
+      "eval_steps_per_second": 2.048,
+      "step": 2889
+    },
+    {
+      "epoch": 27.1,
+      "learning_rate": 1.0834198684665976e-05,
+      "loss": 0.2647,
+      "step": 2900
+    },
+    {
+      "epoch": 27.57,
+      "learning_rate": 9.10349601938387e-06,
+      "loss": 0.2495,
+      "step": 2950
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.7961992136304062,
+      "eval_loss": 1.1401643753051758,
+      "eval_runtime": 23.4674,
+      "eval_samples_per_second": 65.026,
+      "eval_steps_per_second": 2.045,
+      "step": 2996
+    },
+    {
+      "epoch": 28.04,
+      "learning_rate": 7.372793354101766e-06,
+      "loss": 0.2434,
+      "step": 3000
+    },
+    {
+      "epoch": 28.5,
+      "learning_rate": 5.642090688819661e-06,
+      "loss": 0.2345,
+      "step": 3050
+    },
+    {
+      "epoch": 28.97,
+      "learning_rate": 3.9113880235375566e-06,
+      "loss": 0.2467,
+      "step": 3100
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.7981651376146789,
+      "eval_loss": 1.1323330402374268,
+      "eval_runtime": 23.4948,
+      "eval_samples_per_second": 64.951,
+      "eval_steps_per_second": 2.043,
+      "step": 3103
+    },
+    {
+      "epoch": 29.44,
+      "learning_rate": 2.1806853582554518e-06,
+      "loss": 0.2289,
+      "step": 3150
+    },
+    {
+      "epoch": 29.9,
+      "learning_rate": 4.845967462789893e-07,
+      "loss": 0.2438,
+      "step": 3200
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.8001310615989515,
+      "eval_loss": 1.138134479522705,
+      "eval_runtime": 23.5462,
+      "eval_samples_per_second": 64.809,
+      "eval_steps_per_second": 2.039,
+      "step": 3210
+    }
+  ],
+  "max_steps": 3210,
+  "num_train_epochs": 30,
+  "total_flos": 1.2493706670677769e+20,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b6b5f205b08f6f779bd7a788849ccfab4ae877cb2e30618172a56f0c71b8be1
+size 3503