Upload 13 files

Browse files

Files changed (8) hide show

added_tokens.json +32 -30
model.safetensors +2 -2
scheduler.pt +1 -1
special_tokens_map.json +28 -4
tokenizer.json +2 -2
tokenizer_config.json +293 -0
trainer_state.json +171 -73
training_args.bin +1 -1

added_tokens.json CHANGED Viewed

@@ -1,32 +1,34 @@
 {
-  "<active_listening>": 50027,
-  "<apology>": 50012,
-  "<bos>": 50002,
-  "<cls>": 50007,
-  "<empathy>": 50026,
-  "<eos>": 50003,
-  "<farewell>": 50010,
-  "<greeting>": 50009,
-  "<mask>": 50008,
-  "<open_ended_question>": 50028,
-  "<pad>": 50004,
-  "<reflective_summary>": 50029,
-  "<sep>": 50006,
-  "<thank>": 50011,
-  "<unk>": 50005,
-  "<|endoftext|>": 50000,
-  "<|pad|>": 50001,
-  "active_listening": 50023,
-  "amazeballs": 50013,
-  "bromance": 50021,
-  "crowdfunding": 50020,
-  "cryptocurrency": 50014,
-  "facepalm": 50019,
-  "hangry": 50022,
-  "open_ended_question": 50024,
-  "photobomb": 50018,
-  "reflective_summary": 50025,
-  "upcycle": 50017,
-  "vlog": 50016,
-  "webinar": 50015
 }

 {
+  "<active_listening>": 50286,
+  "<apology>": 50268,
+  "<bos>": 50258,
+  "<cls>": 50263,
+  "<empathy>": 50285,
+  "<eos>": 50259,
+  "<farewell>": 50266,
+  "<greeting>": 50265,
+  "<mask>": 50264,
+  "<open_ended_question>": 50287,
+  "<pad>": 50260,
+  "<reflective_summary>": 50288,
+  "<sep>": 50262,
+  "<thank>": 50267,
+  "<unk>": 50261,
+  "<|pad|>": 50257,
+  "[PAD]": 50269,
+  "active_listening": 50282,
+  "amazeballs": 50271,
+  "bromance": 50279,
+  "crowdfunding": 50278,
+  "cryptocurrency": 50272,
+  "empathy": 50281,
+  "facepalm": 50277,
+  "hangry": 50280,
+  "intelligent": 50270,
+  "open_ended_question": 50283,
+  "photobomb": 50276,
+  "reflective_summary": 50284,
+  "upcycle": 50275,
+  "vlog": 50274,
+  "webinar": 50273
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfbfe49a0df1bf0c68b96e533cfcac9860d224e6cd93987cefd99755aeed9293
-size 1650346720

 version https://git-lfs.github.com/spec/v1
+oid sha256:da95f6795f77c45c2ab157a5234496e42cf4bda36a3383b9e497c874124f10cd
+size 1419322880

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5fd77b5f09d2be234b9c114ec17c3402cfa26c5f985967d53d9ecd811d60c62d
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:82b5567834074c579fcb3e78e7c6dcacf1051d2f04e2ff9f05db6922ac7fbb04
 size 1064

special_tokens_map.json CHANGED Viewed

@@ -1,6 +1,30 @@
 {
-  "bos_token": "<|endoftext|>",
-  "eos_token": "<|endoftext|>",
-  "pad_token": "<|endoftext|>",
-  "unk_token": "<|endoftext|>"
 }

 {
+  "bos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
 }

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1c20b7a90d2b5bd165c0532f7f94a9f412f47fe9fca3bb900b0a9cfd95365d1
-size 2114555

 version https://git-lfs.github.com/spec/v1
+oid sha256:42ae0200393412dd1e8cb527e4f3016749edc4fb5820904972a3220115d5fa0a
+size 2114610

tokenizer_config.json CHANGED Viewed

@@ -1,6 +1,38 @@
 {
   "add_prefix_space": false,
   "added_tokens_decoder": {
     "50256": {
       "content": "<|endoftext|>",
       "lstrip": false,
@@ -8,6 +40,262 @@
       "rstrip": false,
       "single_word": false,
       "special": true
     }
   },
   "bos_token": "<|endoftext|>",
@@ -15,9 +303,14 @@
   "eos_token": "<|endoftext|>",
   "max_length": 1024,
   "model_max_length": 1024,
   "pad_token": "<|endoftext|>",
   "padding": "max_length",
   "tokenizer_class": "GPT2Tokenizer",
   "truncation_strategy": "longest_first",
   "unk_token": "<|endoftext|>"
 }

 {
   "add_prefix_space": false,
   "added_tokens_decoder": {
+    "11274": {
+      "content": "good",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "26209": {
+      "content": "response",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "34191": {
+      "content": "happy",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "38986": {
+      "content": "environment",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
     "50256": {
       "content": "<|endoftext|>",
       "lstrip": false,
       "rstrip": false,
       "single_word": false,
       "special": true
+    },
+    "50257": {
+      "content": "<|pad|>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50258": {
+      "content": "<bos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50259": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50260": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50261": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50262": {
+      "content": "<sep>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50263": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50265": {
+      "content": "<greeting>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50266": {
+      "content": "<farewell>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50267": {
+      "content": "<thank>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50268": {
+      "content": "<apology>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50269": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50270": {
+      "content": "intelligent",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50271": {
+      "content": "amazeballs",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50272": {
+      "content": "cryptocurrency",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50273": {
+      "content": "webinar",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50274": {
+      "content": "vlog",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50275": {
+      "content": "upcycle",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50276": {
+      "content": "photobomb",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50277": {
+      "content": "facepalm",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50278": {
+      "content": "crowdfunding",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50279": {
+      "content": "bromance",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50280": {
+      "content": "hangry",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50281": {
+      "content": "empathy",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50282": {
+      "content": "active_listening",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50283": {
+      "content": "open_ended_question",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50284": {
+      "content": "reflective_summary",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50285": {
+      "content": "<empathy>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50286": {
+      "content": "<active_listening>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50287": {
+      "content": "<open_ended_question>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
+    },
+    "50288": {
+      "content": "<reflective_summary>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": false
     }
   },
   "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
   "max_length": 1024,
   "model_max_length": 1024,
+  "pad_to_multiple_of": null,
   "pad_token": "<|endoftext|>",
+  "pad_token_type_id": 0,
   "padding": "max_length",
+  "padding_side": "right",
+  "stride": 0,
   "tokenizer_class": "GPT2Tokenizer",
+  "truncation_side": "right",
   "truncation_strategy": "longest_first",
   "unk_token": "<|endoftext|>"
 }

trainer_state.json CHANGED Viewed

@@ -3,136 +3,234 @@
   "best_model_checkpoint": null,
   "epoch": 3.0,
   "eval_steps": 500,
-  "global_step": 141,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.2127659574468085,
-      "grad_norm": 14.269296646118164,
-      "learning_rate": 4.858156028368794e-05,
-      "loss": 17.1938,
       "step": 10
     },
     {
-      "epoch": 0.425531914893617,
-      "grad_norm": 6.576030254364014,
-      "learning_rate": 4.50354609929078e-05,
-      "loss": 8.7349,
       "step": 20
     },
     {
-      "epoch": 0.6382978723404256,
-      "grad_norm": 9.514806747436523,
-      "learning_rate": 4.148936170212766e-05,
-      "loss": 7.7678,
       "step": 30
     },
     {
-      "epoch": 0.851063829787234,
-      "grad_norm": 9.582891464233398,
-      "learning_rate": 3.794326241134752e-05,
-      "loss": 7.0878,
       "step": 40
     },
     {
       "epoch": 1.0,
-      "eval_loss": 6.37921142578125,
-      "eval_runtime": 5.6868,
-      "eval_samples_per_second": 7.386,
-      "eval_steps_per_second": 1.934,
-      "step": 47
     },
     {
       "epoch": 1.0638297872340425,
-      "grad_norm": 12.990375518798828,
-      "learning_rate": 3.4397163120567377e-05,
-      "loss": 6.86,
-      "step": 50
     },
     {
-      "epoch": 1.2765957446808511,
-      "grad_norm": 12.003615379333496,
       "learning_rate": 3.085106382978723e-05,
-      "loss": 6.5234,
-      "step": 60
     },
     {
-      "epoch": 1.4893617021276595,
-      "grad_norm": 14.846796989440918,
       "learning_rate": 2.7304964539007094e-05,
-      "loss": 6.2994,
-      "step": 70
     },
     {
-      "epoch": 1.702127659574468,
-      "grad_norm": 15.324792861938477,
       "learning_rate": 2.3758865248226954e-05,
-      "loss": 6.1691,
-      "step": 80
     },
     {
-      "epoch": 1.9148936170212765,
-      "grad_norm": 11.699965476989746,
       "learning_rate": 2.0212765957446807e-05,
-      "loss": 6.1812,
-      "step": 90
     },
     {
       "epoch": 2.0,
-      "eval_loss": 5.777428150177002,
-      "eval_runtime": 6.2453,
-      "eval_samples_per_second": 6.725,
-      "eval_steps_per_second": 1.761,
-      "step": 94
     },
     {
-      "epoch": 2.127659574468085,
-      "grad_norm": 13.892985343933105,
       "learning_rate": 1.6666666666666667e-05,
-      "loss": 6.0102,
-      "step": 100
     },
     {
-      "epoch": 2.3404255319148937,
-      "grad_norm": 15.94567584991455,
       "learning_rate": 1.3120567375886524e-05,
-      "loss": 5.9313,
-      "step": 110
     },
     {
-      "epoch": 2.5531914893617023,
-      "grad_norm": 10.468910217285156,
       "learning_rate": 9.574468085106383e-06,
-      "loss": 6.013,
-      "step": 120
     },
     {
-      "epoch": 2.7659574468085104,
-      "grad_norm": 10.299534797668457,
       "learning_rate": 6.028368794326241e-06,
-      "loss": 5.9602,
-      "step": 130
     },
     {
-      "epoch": 2.978723404255319,
-      "grad_norm": 12.492215156555176,
       "learning_rate": 2.4822695035460995e-06,
-      "loss": 5.8626,
-      "step": 140
     },
     {
       "epoch": 3.0,
-      "eval_loss": 5.686648845672607,
-      "eval_runtime": 6.8751,
-      "eval_samples_per_second": 6.109,
-      "eval_steps_per_second": 1.6,
-      "step": 141
     }
   ],
   "logging_steps": 10,
-  "max_steps": 141,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 500,

   "best_model_checkpoint": null,
   "epoch": 3.0,
   "eval_steps": 500,
+  "global_step": 282,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.10638297872340426,
+      "grad_norm": 3.6553943157196045,
+      "learning_rate": 4.840425531914894e-05,
+      "loss": 0.9456,
       "step": 10
     },
     {
+      "epoch": 0.2127659574468085,
+      "grad_norm": 3.9983913898468018,
+      "learning_rate": 4.663120567375887e-05,
+      "loss": 0.8552,
       "step": 20
     },
     {
+      "epoch": 0.3191489361702128,
+      "grad_norm": 3.7922072410583496,
+      "learning_rate": 4.48581560283688e-05,
+      "loss": 1.0052,
       "step": 30
     },
     {
+      "epoch": 0.425531914893617,
+      "grad_norm": 3.6140127182006836,
+      "learning_rate": 4.3262411347517734e-05,
+      "loss": 0.9121,
       "step": 40
     },
+    {
+      "epoch": 0.5319148936170213,
+      "grad_norm": 3.507614850997925,
+      "learning_rate": 4.148936170212766e-05,
+      "loss": 0.8598,
+      "step": 50
+    },
+    {
+      "epoch": 0.6382978723404256,
+      "grad_norm": 4.006348133087158,
+      "learning_rate": 3.971631205673759e-05,
+      "loss": 0.9708,
+      "step": 60
+    },
+    {
+      "epoch": 0.7446808510638298,
+      "grad_norm": 4.814829349517822,
+      "learning_rate": 3.794326241134752e-05,
+      "loss": 0.8753,
+      "step": 70
+    },
+    {
+      "epoch": 0.851063829787234,
+      "grad_norm": 4.398285388946533,
+      "learning_rate": 3.617021276595745e-05,
+      "loss": 0.9466,
+      "step": 80
+    },
+    {
+      "epoch": 0.9574468085106383,
+      "grad_norm": 4.186042785644531,
+      "learning_rate": 3.4397163120567377e-05,
+      "loss": 0.9408,
+      "step": 90
+    },
     {
       "epoch": 1.0,
+      "eval_loss": 2.226564645767212,
+      "eval_runtime": 9.5187,
+      "eval_samples_per_second": 4.412,
+      "eval_steps_per_second": 1.156,
+      "step": 94
     },
     {
       "epoch": 1.0638297872340425,
+      "grad_norm": 3.774606227874756,
+      "learning_rate": 3.262411347517731e-05,
+      "loss": 0.8182,
+      "step": 100
     },
     {
+      "epoch": 1.1702127659574468,
+      "grad_norm": 3.641083240509033,
       "learning_rate": 3.085106382978723e-05,
+      "loss": 0.7849,
+      "step": 110
     },
     {
+      "epoch": 1.2765957446808511,
+      "grad_norm": 5.060397624969482,
+      "learning_rate": 2.9078014184397162e-05,
+      "loss": 0.7795,
+      "step": 120
+    },
+    {
+      "epoch": 1.3829787234042552,
+      "grad_norm": 3.457118272781372,
       "learning_rate": 2.7304964539007094e-05,
+      "loss": 0.723,
+      "step": 130
     },
     {
+      "epoch": 1.4893617021276595,
+      "grad_norm": 3.421212673187256,
+      "learning_rate": 2.5531914893617022e-05,
+      "loss": 0.6819,
+      "step": 140
+    },
+    {
+      "epoch": 1.5957446808510638,
+      "grad_norm": 3.1989083290100098,
       "learning_rate": 2.3758865248226954e-05,
+      "loss": 0.6891,
+      "step": 150
     },
     {
+      "epoch": 1.702127659574468,
+      "grad_norm": 3.486337661743164,
+      "learning_rate": 2.1985815602836882e-05,
+      "loss": 0.7369,
+      "step": 160
+    },
+    {
+      "epoch": 1.8085106382978724,
+      "grad_norm": 3.4989173412323,
       "learning_rate": 2.0212765957446807e-05,
+      "loss": 0.7042,
+      "step": 170
+    },
+    {
+      "epoch": 1.9148936170212765,
+      "grad_norm": 2.965428590774536,
+      "learning_rate": 1.8439716312056736e-05,
+      "loss": 0.712,
+      "step": 180
     },
     {
       "epoch": 2.0,
+      "eval_loss": 2.416543483734131,
+      "eval_runtime": 9.5843,
+      "eval_samples_per_second": 4.382,
+      "eval_steps_per_second": 1.148,
+      "step": 188
     },
     {
+      "epoch": 2.021276595744681,
+      "grad_norm": 4.359320640563965,
       "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.7045,
+      "step": 190
     },
     {
+      "epoch": 2.127659574468085,
+      "grad_norm": 3.513986825942993,
+      "learning_rate": 1.4893617021276596e-05,
+      "loss": 0.6259,
+      "step": 200
+    },
+    {
+      "epoch": 2.2340425531914896,
+      "grad_norm": 4.127784252166748,
       "learning_rate": 1.3120567375886524e-05,
+      "loss": 0.6355,
+      "step": 210
     },
     {
+      "epoch": 2.3404255319148937,
+      "grad_norm": 3.798154592514038,
+      "learning_rate": 1.1347517730496454e-05,
+      "loss": 0.5645,
+      "step": 220
+    },
+    {
+      "epoch": 2.4468085106382977,
+      "grad_norm": 3.0239367485046387,
       "learning_rate": 9.574468085106383e-06,
+      "loss": 0.6694,
+      "step": 230
     },
     {
+      "epoch": 2.5531914893617023,
+      "grad_norm": 3.148362398147583,
+      "learning_rate": 7.801418439716313e-06,
+      "loss": 0.6103,
+      "step": 240
+    },
+    {
+      "epoch": 2.6595744680851063,
+      "grad_norm": 4.111635684967041,
       "learning_rate": 6.028368794326241e-06,
+      "loss": 0.5299,
+      "step": 250
     },
     {
+      "epoch": 2.7659574468085104,
+      "grad_norm": 3.042776107788086,
+      "learning_rate": 4.255319148936171e-06,
+      "loss": 0.5928,
+      "step": 260
+    },
+    {
+      "epoch": 2.872340425531915,
+      "grad_norm": 3.5736513137817383,
       "learning_rate": 2.4822695035460995e-06,
+      "loss": 0.6444,
+      "step": 270
+    },
+    {
+      "epoch": 2.978723404255319,
+      "grad_norm": 3.4036762714385986,
+      "learning_rate": 7.092198581560284e-07,
+      "loss": 0.5531,
+      "step": 280
     },
     {
       "epoch": 3.0,
+      "eval_loss": 2.504506826400757,
+      "eval_runtime": 14.1693,
+      "eval_samples_per_second": 2.964,
+      "eval_steps_per_second": 0.776,
+      "step": 282
     }
   ],
   "logging_steps": 10,
+  "max_steps": 282,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 3,
   "save_steps": 500,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a6300bd64a2133832e68dd195890f548ec75ffbdaa6208036f80c4a9b9edd6a
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:c09957992ab27156ce48711b6f9e348d9a1a021722d41a33fbaa4988104c8e58
 size 5112