xuancoblab2023 commited on Mar 24, 2024

Commit

5993472

verified ·

1 Parent(s): 4ba0e2b

Training in progress, epoch 1

Browse files

Files changed (37) hide show

logs/events.out.tfevents.1711297556.8cc2eef2edb7.2942.10 +2 -2
logs/events.out.tfevents.1711297672.8cc2eef2edb7.2942.11 +3 -0
model.safetensors +1 -1
run-10/checkpoint-1485/config.json +34 -0
run-10/checkpoint-1485/model.safetensors +3 -0
run-10/checkpoint-1485/optimizer.pt +3 -0
run-10/checkpoint-1485/rng_state.pth +3 -0
run-10/checkpoint-1485/scheduler.pt +3 -0
run-10/checkpoint-1485/special_tokens_map.json +7 -0
run-10/checkpoint-1485/tokenizer.json +0 -0
run-10/checkpoint-1485/tokenizer_config.json +57 -0
run-10/checkpoint-1485/trainer_state.json +126 -0
run-10/checkpoint-1485/training_args.bin +3 -0
run-10/checkpoint-1485/vocab.txt +0 -0
run-10/checkpoint-1782/config.json +34 -0
run-10/checkpoint-1782/model.safetensors +3 -0
run-10/checkpoint-1782/optimizer.pt +3 -0
run-10/checkpoint-1782/rng_state.pth +3 -0
run-10/checkpoint-1782/scheduler.pt +3 -0
run-10/checkpoint-1782/special_tokens_map.json +7 -0
run-10/checkpoint-1782/tokenizer.json +0 -0
run-10/checkpoint-1782/tokenizer_config.json +57 -0
run-10/checkpoint-1782/trainer_state.json +146 -0
run-10/checkpoint-1782/training_args.bin +3 -0
run-10/checkpoint-1782/vocab.txt +0 -0
run-11/checkpoint-297/config.json +34 -0
run-11/checkpoint-297/model.safetensors +3 -0
run-11/checkpoint-297/optimizer.pt +3 -0
run-11/checkpoint-297/rng_state.pth +3 -0
run-11/checkpoint-297/scheduler.pt +3 -0
run-11/checkpoint-297/special_tokens_map.json +7 -0
run-11/checkpoint-297/tokenizer.json +0 -0
run-11/checkpoint-297/tokenizer_config.json +57 -0
run-11/checkpoint-297/trainer_state.json +46 -0
run-11/checkpoint-297/training_args.bin +3 -0
run-11/checkpoint-297/vocab.txt +0 -0
training_args.bin +2 -2

logs/events.out.tfevents.1711297556.8cc2eef2edb7.2942.10 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6adc87ff7eee0ce47303d7d36afd1f8f189366e534271b06ed92957f5693016e
-size 6137

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f268f3ba50235960b9469426820d384dc42af99cb29b1118b07efc6868b6802
+size 9411

logs/events.out.tfevents.1711297672.8cc2eef2edb7.2942.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e47f7c5fb03a345021671d2f09e19f453c5934fb37de0308a180be5cc027f03c
+size 5406

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0357fb092c644e21a7a496383ce1471a9bb139c8cf8b29278061531e65ee0497
 size 17549312

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1d78ba7bedd6c730ac672a0cc4b3d275d973b5be969fd8e11171dbb4478edd2
 size 17549312

run-10/checkpoint-1485/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/bert_uncased_L-2_H-128_A-2",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 128,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "label2id": {
+    "negative": "0",
+    "positive": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-10/checkpoint-1485/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df1331983778cc0d1d336a9eade3e6658e75d352f1a4b9cd41668f7b6515050b
+size 17549312

run-10/checkpoint-1485/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b26b7e5ce199cdc75b5c94addd8c5399fac83288e1b2f3c394ed86b1cfa594d8
+size 35123898

run-10/checkpoint-1485/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:60c532b5f010242990de7c2dd8b4cd2d14624b3c168e0dbeb7940a12d466a7dc
+size 14308

run-10/checkpoint-1485/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:331dbc3040669dde15a191184be3807b8b0421da16e770fb579f7bc137ea9974
+size 1064

run-10/checkpoint-1485/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-1485/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-10/checkpoint-1485/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-1485/trainer_state.json ADDED Viewed

	@@ -0,0 +1,126 @@

+{
+  "best_metric": 0.6792079207920793,
+  "best_model_checkpoint": "tiny-bert-sst2-distilled/run-10/checkpoint-1485",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 1485,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 2.256939649581909,
+      "learning_rate": 0.00020003476406791257,
+      "loss": 0.6792,
+      "step": 297
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5623762376237624,
+      "eval_f1": 0.4199475065616798,
+      "eval_loss": 0.6835970878601074,
+      "eval_mcc": 0.14191809339823447,
+      "eval_precision": 0.6201550387596899,
+      "eval_recall": 0.31746031746031744,
+      "eval_runtime": 0.9302,
+      "eval_samples_per_second": 542.921,
+      "eval_steps_per_second": 17.201,
+      "step": 297
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 2.075068712234497,
+      "learning_rate": 0.00016002781125433002,
+      "loss": 0.6413,
+      "step": 594
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6475247524752475,
+      "eval_f1": 0.6920415224913495,
+      "eval_loss": 0.6267873644828796,
+      "eval_mcc": 0.3090077890032306,
+      "eval_precision": 0.6134969325153374,
+      "eval_recall": 0.7936507936507936,
+      "eval_runtime": 0.9329,
+      "eval_samples_per_second": 541.318,
+      "eval_steps_per_second": 17.151,
+      "step": 594
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 2.5431761741638184,
+      "learning_rate": 0.00012002085844074753,
+      "loss": 0.6128,
+      "step": 891
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6376237623762376,
+      "eval_f1": 0.7127158555729984,
+      "eval_loss": 0.6455628275871277,
+      "eval_mcc": 0.3245645841843151,
+      "eval_precision": 0.5896103896103896,
+      "eval_recall": 0.9007936507936508,
+      "eval_runtime": 0.9321,
+      "eval_samples_per_second": 541.772,
+      "eval_steps_per_second": 17.165,
+      "step": 891
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 1.826803207397461,
+      "learning_rate": 8.001390562716501e-05,
+      "loss": 0.5934,
+      "step": 1188
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6554455445544555,
+      "eval_f1": 0.7156862745098039,
+      "eval_loss": 0.6337190866470337,
+      "eval_mcc": 0.3445175537543676,
+      "eval_precision": 0.6083333333333333,
+      "eval_recall": 0.8690476190476191,
+      "eval_runtime": 0.9303,
+      "eval_samples_per_second": 542.814,
+      "eval_steps_per_second": 17.198,
+      "step": 1188
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 3.4030377864837646,
+      "learning_rate": 4.0006952813582505e-05,
+      "loss": 0.5801,
+      "step": 1485
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6792079207920793,
+      "eval_f1": 0.7054545454545453,
+      "eval_loss": 0.6095411777496338,
+      "eval_mcc": 0.3647441045625896,
+      "eval_precision": 0.6510067114093959,
+      "eval_recall": 0.7698412698412699,
+      "eval_runtime": 0.9333,
+      "eval_samples_per_second": 541.076,
+      "eval_steps_per_second": 17.143,
+      "step": 1485
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 1782,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
+  "save_steps": 500,
+  "total_flos": 3653506329900.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": {
+    "alpha": 0.9802546625572438,
+    "learning_rate": 0.00024004171688149506,
+    "num_train_epochs": 6,
+    "temperature": 49
+  }
+}

run-10/checkpoint-1485/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2f00f9e41c59dd180c45edf27f2b5cce7facf08fcb4e44e2c4108d00dc05a63
+size 4920

run-10/checkpoint-1485/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-10/checkpoint-1782/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/bert_uncased_L-2_H-128_A-2",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 128,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "label2id": {
+    "negative": "0",
+    "positive": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-10/checkpoint-1782/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1ffbb9a320b88b62c4cedb0931589ad43261ac61ee4d66dd139c1c3a37493ea
+size 17549312

run-10/checkpoint-1782/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01c82c7d773bafba52ec0ad55ed93d563780cbd0b4a1503ac2ffc18fca1800ce
+size 35123898

run-10/checkpoint-1782/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a02d6fe58f222754d8b6c88c72e65619363bb5593417cc44e98640fe115ffbc
+size 14308

run-10/checkpoint-1782/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:35fa6d2198c1bb970ba637749b33d105fbaf514e567489c39fffa43deab06728
+size 1064

run-10/checkpoint-1782/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-1782/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-10/checkpoint-1782/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-10/checkpoint-1782/trainer_state.json ADDED Viewed

	@@ -0,0 +1,146 @@

+{
+  "best_metric": 0.6831683168316832,
+  "best_model_checkpoint": "tiny-bert-sst2-distilled/run-10/checkpoint-1782",
+  "epoch": 6.0,
+  "eval_steps": 500,
+  "global_step": 1782,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 2.256939649581909,
+      "learning_rate": 0.00020003476406791257,
+      "loss": 0.6792,
+      "step": 297
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5623762376237624,
+      "eval_f1": 0.4199475065616798,
+      "eval_loss": 0.6835970878601074,
+      "eval_mcc": 0.14191809339823447,
+      "eval_precision": 0.6201550387596899,
+      "eval_recall": 0.31746031746031744,
+      "eval_runtime": 0.9302,
+      "eval_samples_per_second": 542.921,
+      "eval_steps_per_second": 17.201,
+      "step": 297
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 2.075068712234497,
+      "learning_rate": 0.00016002781125433002,
+      "loss": 0.6413,
+      "step": 594
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6475247524752475,
+      "eval_f1": 0.6920415224913495,
+      "eval_loss": 0.6267873644828796,
+      "eval_mcc": 0.3090077890032306,
+      "eval_precision": 0.6134969325153374,
+      "eval_recall": 0.7936507936507936,
+      "eval_runtime": 0.9329,
+      "eval_samples_per_second": 541.318,
+      "eval_steps_per_second": 17.151,
+      "step": 594
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 2.5431761741638184,
+      "learning_rate": 0.00012002085844074753,
+      "loss": 0.6128,
+      "step": 891
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6376237623762376,
+      "eval_f1": 0.7127158555729984,
+      "eval_loss": 0.6455628275871277,
+      "eval_mcc": 0.3245645841843151,
+      "eval_precision": 0.5896103896103896,
+      "eval_recall": 0.9007936507936508,
+      "eval_runtime": 0.9321,
+      "eval_samples_per_second": 541.772,
+      "eval_steps_per_second": 17.165,
+      "step": 891
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 1.826803207397461,
+      "learning_rate": 8.001390562716501e-05,
+      "loss": 0.5934,
+      "step": 1188
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6554455445544555,
+      "eval_f1": 0.7156862745098039,
+      "eval_loss": 0.6337190866470337,
+      "eval_mcc": 0.3445175537543676,
+      "eval_precision": 0.6083333333333333,
+      "eval_recall": 0.8690476190476191,
+      "eval_runtime": 0.9303,
+      "eval_samples_per_second": 542.814,
+      "eval_steps_per_second": 17.198,
+      "step": 1188
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 3.4030377864837646,
+      "learning_rate": 4.0006952813582505e-05,
+      "loss": 0.5801,
+      "step": 1485
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6792079207920793,
+      "eval_f1": 0.7054545454545453,
+      "eval_loss": 0.6095411777496338,
+      "eval_mcc": 0.3647441045625896,
+      "eval_precision": 0.6510067114093959,
+      "eval_recall": 0.7698412698412699,
+      "eval_runtime": 0.9333,
+      "eval_samples_per_second": 541.076,
+      "eval_steps_per_second": 17.143,
+      "step": 1485
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 3.6899707317352295,
+      "learning_rate": 0.0,
+      "loss": 0.5709,
+      "step": 1782
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.6831683168316832,
+      "eval_f1": 0.7090909090909091,
+      "eval_loss": 0.6130138039588928,
+      "eval_mcc": 0.3727967308109112,
+      "eval_precision": 0.6543624161073825,
+      "eval_recall": 0.7738095238095238,
+      "eval_runtime": 0.9378,
+      "eval_samples_per_second": 538.498,
+      "eval_steps_per_second": 17.061,
+      "step": 1782
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 1782,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
+  "save_steps": 500,
+  "total_flos": 4384207595880.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": {
+    "alpha": 0.9802546625572438,
+    "learning_rate": 0.00024004171688149506,
+    "num_train_epochs": 6,
+    "temperature": 49
+  }
+}

run-10/checkpoint-1782/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2f00f9e41c59dd180c45edf27f2b5cce7facf08fcb4e44e2c4108d00dc05a63
+size 4920

run-10/checkpoint-1782/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-11/checkpoint-297/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/bert_uncased_L-2_H-128_A-2",
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 128,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "label2id": {
+    "negative": "0",
+    "positive": "1"
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.1",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

run-11/checkpoint-297/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d1d78ba7bedd6c730ac672a0cc4b3d275d973b5be969fd8e11171dbb4478edd2
+size 17549312

run-11/checkpoint-297/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9744948f029d704417919636217644e003e100c4c314496bbde3767667adce02
+size 35123898

run-11/checkpoint-297/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a5f5e396c574b9b2ecc40d3f9e87d628a8f4be69caef81905a47fcf8895067e6
+size 14308

run-11/checkpoint-297/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1a6348a8869d62ebaf5e6a8549a6157b53881a2f63c016076dbbd529d2581834
+size 1064

run-11/checkpoint-297/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-11/checkpoint-297/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-11/checkpoint-297/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

run-11/checkpoint-297/trainer_state.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "best_metric": 0.5623762376237624,
+  "best_model_checkpoint": "tiny-bert-sst2-distilled/run-11/checkpoint-297",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 297,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 2.1475601196289062,
+      "learning_rate": 0.00023316325483820226,
+      "loss": 0.6759,
+      "step": 297
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5623762376237624,
+      "eval_f1": 0.3402985074626866,
+      "eval_loss": 0.672980785369873,
+      "eval_mcc": 0.1665189802603812,
+      "eval_precision": 0.6867469879518072,
+      "eval_recall": 0.2261904761904762,
+      "eval_runtime": 0.9357,
+      "eval_samples_per_second": 539.729,
+      "eval_steps_per_second": 17.1,
+      "step": 297
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 1782,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 6,
+  "save_steps": 500,
+  "total_flos": 730701265980.0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": {
+    "alpha": 0.9735237137483809,
+    "learning_rate": 0.0002797959058058427,
+    "num_train_epochs": 6,
+    "temperature": 49
+  }
+}

run-11/checkpoint-297/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:124ecb31d14b93653c0465f644e05b3427871c8d7678267355c896850165721c
+size 4920

run-11/checkpoint-297/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f91d80d8fa16254fc8cafbdb71abffe2e808a53378473794805afa08c4e2bbeb
-size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:124ecb31d14b93653c0465f644e05b3427871c8d7678267355c896850165721c
+size 4920