End of training

Browse files

Files changed (4) hide show

README.md +13 -0
adapter_model.bin +1 -1
runs/Jul26_13-26-01_37f0fbb90905/events.out.tfevents.1690378681.37f0fbb90905.5486.1 +2 -2
trainer_state.json +156 -357

README.md CHANGED Viewed

@@ -5,6 +5,7 @@ tags:
 model-index:
 - name: llama-2-7b-reward-oasst1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -36,6 +37,17 @@ More information needed
 ## Training procedure
 ### Training hyperparameters
 The following hyperparameters were used during training:
@@ -51,6 +63,7 @@ The following hyperparameters were used during training:
 ### Framework versions
 - Transformers 4.32.0.dev0
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.0

 model-index:
 - name: llama-2-7b-reward-oasst1
   results: []
+library_name: peft
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 ## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float16
 ### Training hyperparameters
 The following hyperparameters were used during training:
 ### Framework versions
+- PEFT 0.5.0.dev0
 - Transformers 4.32.0.dev0
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.0

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ca86272c09ee12ad51e3dd3fa34800ac25d445b24404b2334f5f602b82d01fb5
 size 33617169

 version https://git-lfs.github.com/spec/v1
+oid sha256:c28e6b880cb10257b54341041ba350a3702b791043b6f9c38cc5fdd4ea4beb96
 size 33617169

runs/Jul26_13-26-01_37f0fbb90905/events.out.tfevents.1690378681.37f0fbb90905.5486.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f5eb2378b8807874cde36b8d6b221bb892d2904e1a80158dd870bbdb3f98c60
-size 11119

 version https://git-lfs.github.com/spec/v1
+oid sha256:281b0194e10344d5e0cad0182c29d82ec860dc9529dd505bce4bbc73c980cc11
+size 12541

trainer_state.json CHANGED Viewed

@@ -1,500 +1,299 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.7561820571018995,
-  "global_step": 3165,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.01,
-      "learning_rate": 1.978494623655914e-05,
-      "loss": 1.0308,
       "step": 50
     },
     {
-      "epoch": 0.02,
-      "learning_rate": 1.954599761051374e-05,
-      "loss": 0.7656,
       "step": 100
     },
     {
-      "epoch": 0.04,
-      "learning_rate": 1.930704898446834e-05,
-      "loss": 0.8032,
       "step": 150
     },
     {
-      "epoch": 0.05,
-      "learning_rate": 1.906810035842294e-05,
-      "loss": 0.7398,
       "step": 200
     },
     {
-      "epoch": 0.06,
-      "learning_rate": 1.882915173237754e-05,
-      "loss": 0.7004,
       "step": 250
     },
     {
-      "epoch": 0.06,
-      "eval_accuracy": 0.6535433070866141,
-      "eval_loss": 0.7174085378646851,
-      "eval_runtime": 431.9798,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
       "step": 250
     },
     {
-      "epoch": 0.07,
-      "learning_rate": 1.859020310633214e-05,
-      "loss": 0.8009,
       "step": 300
     },
     {
-      "epoch": 0.08,
-      "learning_rate": 1.835125448028674e-05,
-      "loss": 0.6551,
       "step": 350
     },
     {
-      "epoch": 0.1,
-      "learning_rate": 1.811230585424134e-05,
-      "loss": 0.6348,
       "step": 400
     },
     {
-      "epoch": 0.11,
-      "learning_rate": 1.787335722819594e-05,
-      "loss": 0.5236,
       "step": 450
     },
     {
-      "epoch": 0.12,
-      "learning_rate": 1.763440860215054e-05,
-      "loss": 0.6735,
       "step": 500
     },
     {
-      "epoch": 0.12,
-      "eval_accuracy": 0.7007874015748031,
-      "eval_loss": 0.6178467869758606,
-      "eval_runtime": 430.5762,
-      "eval_samples_per_second": 2.065,
-      "eval_steps_per_second": 2.065,
       "step": 500
     },
     {
-      "epoch": 0.13,
-      "learning_rate": 1.7395459976105136e-05,
-      "loss": 0.7371,
       "step": 550
     },
     {
-      "epoch": 0.14,
-      "learning_rate": 1.7156511350059738e-05,
-      "loss": 0.6957,
       "step": 600
     },
     {
-      "epoch": 0.16,
-      "learning_rate": 1.691756272401434e-05,
-      "loss": 0.592,
       "step": 650
     },
     {
-      "epoch": 0.17,
-      "learning_rate": 1.6678614097968937e-05,
-      "loss": 0.5799,
       "step": 700
     },
     {
-      "epoch": 0.18,
-      "learning_rate": 1.6439665471923538e-05,
-      "loss": 0.6165,
       "step": 750
     },
     {
-      "epoch": 0.18,
-      "eval_accuracy": 0.7424071991001124,
-      "eval_loss": 0.5588846206665039,
-      "eval_runtime": 431.475,
-      "eval_samples_per_second": 2.06,
-      "eval_steps_per_second": 2.06,
       "step": 750
     },
     {
-      "epoch": 0.19,
-      "learning_rate": 1.6200716845878136e-05,
-      "loss": 0.5045,
       "step": 800
     },
     {
-      "epoch": 0.2,
-      "learning_rate": 1.5961768219832737e-05,
-      "loss": 0.6213,
       "step": 850
     },
     {
-      "epoch": 0.22,
-      "learning_rate": 1.5722819593787338e-05,
-      "loss": 0.6248,
       "step": 900
     },
     {
-      "epoch": 0.23,
-      "learning_rate": 1.5483870967741936e-05,
-      "loss": 0.4998,
       "step": 950
     },
     {
-      "epoch": 0.24,
-      "learning_rate": 1.5244922341696537e-05,
-      "loss": 0.6603,
       "step": 1000
     },
     {
-      "epoch": 0.24,
-      "eval_accuracy": 0.7559055118110236,
-      "eval_loss": 0.5710476636886597,
-      "eval_runtime": 432.0116,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
       "step": 1000
     },
     {
-      "epoch": 0.25,
-      "learning_rate": 1.5005973715651137e-05,
-      "loss": 0.5468,
       "step": 1050
     },
     {
-      "epoch": 0.26,
-      "learning_rate": 1.4767025089605736e-05,
-      "loss": 0.511,
       "step": 1100
     },
     {
-      "epoch": 0.27,
-      "learning_rate": 1.4528076463560337e-05,
-      "loss": 0.5575,
       "step": 1150
     },
     {
-      "epoch": 0.29,
-      "learning_rate": 1.4289127837514935e-05,
-      "loss": 0.7658,
       "step": 1200
     },
     {
-      "epoch": 0.3,
-      "learning_rate": 1.4050179211469535e-05,
-      "loss": 0.5575,
       "step": 1250
     },
     {
-      "epoch": 0.3,
-      "eval_accuracy": 0.7570303712035995,
-      "eval_loss": 0.5421488881111145,
-      "eval_runtime": 430.448,
-      "eval_samples_per_second": 2.065,
-      "eval_steps_per_second": 2.065,
       "step": 1250
     },
     {
-      "epoch": 0.31,
-      "learning_rate": 1.3811230585424136e-05,
-      "loss": 0.6252,
       "step": 1300
     },
     {
-      "epoch": 0.32,
-      "learning_rate": 1.3572281959378735e-05,
-      "loss": 0.4673,
       "step": 1350
     },
     {
-      "epoch": 0.33,
-      "learning_rate": 1.3333333333333333e-05,
-      "loss": 0.5266,
       "step": 1400
     },
     {
-      "epoch": 0.35,
-      "learning_rate": 1.3094384707287935e-05,
-      "loss": 0.6353,
       "step": 1450
     },
     {
-      "epoch": 0.36,
-      "learning_rate": 1.2855436081242534e-05,
-      "loss": 0.589,
       "step": 1500
     },
     {
-      "epoch": 0.36,
-      "eval_accuracy": 0.750281214848144,
-      "eval_loss": 0.5329739451408386,
-      "eval_runtime": 429.8372,
-      "eval_samples_per_second": 2.068,
-      "eval_steps_per_second": 2.068,
       "step": 1500
     },
     {
-      "epoch": 0.37,
-      "learning_rate": 1.2616487455197134e-05,
-      "loss": 0.6944,
       "step": 1550
     },
     {
-      "epoch": 0.38,
-      "learning_rate": 1.2377538829151735e-05,
-      "loss": 0.4992,
       "step": 1600
     },
     {
-      "epoch": 0.39,
-      "learning_rate": 1.2138590203106333e-05,
-      "loss": 0.6429,
       "step": 1650
     },
     {
-      "epoch": 0.41,
-      "learning_rate": 1.1899641577060932e-05,
-      "loss": 0.5243,
       "step": 1700
     },
     {
-      "epoch": 0.42,
-      "learning_rate": 1.1660692951015533e-05,
-      "loss": 0.5644,
-      "step": 1750
-    },
-    {
-      "epoch": 0.42,
-      "eval_accuracy": 0.7559055118110236,
-      "eval_loss": 0.5390347838401794,
-      "eval_runtime": 429.8773,
-      "eval_samples_per_second": 2.068,
-      "eval_steps_per_second": 2.068,
       "step": 1750
     },
-    {
-      "epoch": 0.43,
-      "learning_rate": 1.1421744324970133e-05,
-      "loss": 0.6321,
-      "step": 1800
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 1.118279569892473e-05,
-      "loss": 0.5939,
-      "step": 1850
-    },
-    {
-      "epoch": 0.45,
-      "learning_rate": 1.0943847072879332e-05,
-      "loss": 0.5477,
-      "step": 1900
-    },
-    {
-      "epoch": 0.47,
-      "learning_rate": 1.0704898446833931e-05,
-      "loss": 0.5171,
-      "step": 1950
-    },
-    {
-      "epoch": 0.48,
-      "learning_rate": 1.0465949820788533e-05,
-      "loss": 0.503,
-      "step": 2000
-    },
-    {
-      "epoch": 0.48,
-      "eval_accuracy": 0.7592800899887514,
-      "eval_loss": 0.5502843856811523,
-      "eval_runtime": 429.7289,
-      "eval_samples_per_second": 2.069,
-      "eval_steps_per_second": 2.069,
-      "step": 2000
-    },
-    {
-      "epoch": 0.49,
-      "learning_rate": 1.0227001194743132e-05,
-      "loss": 0.6059,
-      "step": 2050
-    },
-    {
-      "epoch": 0.5,
-      "learning_rate": 9.98805256869773e-06,
-      "loss": 0.5716,
-      "step": 2100
-    },
-    {
-      "epoch": 0.51,
-      "learning_rate": 9.749103942652331e-06,
-      "loss": 0.5367,
-      "step": 2150
-    },
-    {
-      "epoch": 0.53,
-      "learning_rate": 9.51015531660693e-06,
-      "loss": 0.578,
-      "step": 2200
-    },
-    {
-      "epoch": 0.54,
-      "learning_rate": 9.27120669056153e-06,
-      "loss": 0.6361,
-      "step": 2250
-    },
-    {
-      "epoch": 0.54,
-      "eval_accuracy": 0.7637795275590551,
-      "eval_loss": 0.5347180366516113,
-      "eval_runtime": 432.0598,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
-      "step": 2250
-    },
-    {
-      "epoch": 0.55,
-      "learning_rate": 9.03225806451613e-06,
-      "loss": 0.5387,
-      "step": 2300
-    },
-    {
-      "epoch": 0.56,
-      "learning_rate": 8.793309438470729e-06,
-      "loss": 0.5409,
-      "step": 2350
-    },
-    {
-      "epoch": 0.57,
-      "learning_rate": 8.55436081242533e-06,
-      "loss": 0.4895,
-      "step": 2400
-    },
-    {
-      "epoch": 0.59,
-      "learning_rate": 8.315412186379928e-06,
-      "loss": 0.5966,
-      "step": 2450
-    },
-    {
-      "epoch": 0.6,
-      "learning_rate": 8.07646356033453e-06,
-      "loss": 0.517,
-      "step": 2500
-    },
-    {
-      "epoch": 0.6,
-      "eval_accuracy": 0.7649043869516311,
-      "eval_loss": 0.5409161448478699,
-      "eval_runtime": 432.0753,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
-      "step": 2500
-    },
-    {
-      "epoch": 0.61,
-      "learning_rate": 7.837514934289129e-06,
-      "loss": 0.5852,
-      "step": 2550
-    },
-    {
-      "epoch": 0.62,
-      "learning_rate": 7.5985663082437275e-06,
-      "loss": 0.5853,
-      "step": 2600
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 7.359617682198328e-06,
-      "loss": 0.6096,
-      "step": 2650
-    },
-    {
-      "epoch": 0.65,
-      "learning_rate": 7.120669056152928e-06,
-      "loss": 0.6285,
-      "step": 2700
-    },
-    {
-      "epoch": 0.66,
-      "learning_rate": 6.881720430107528e-06,
-      "loss": 0.5481,
-      "step": 2750
-    },
-    {
-      "epoch": 0.66,
-      "eval_accuracy": 0.7525309336332958,
-      "eval_loss": 0.5184136033058167,
-      "eval_runtime": 431.9074,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
-      "step": 2750
-    },
-    {
-      "epoch": 0.67,
-      "learning_rate": 6.642771804062127e-06,
-      "loss": 0.6294,
-      "step": 2800
-    },
-    {
-      "epoch": 0.68,
-      "learning_rate": 6.403823178016727e-06,
-      "loss": 0.5585,
-      "step": 2850
-    },
-    {
-      "epoch": 0.69,
-      "learning_rate": 6.164874551971327e-06,
-      "loss": 0.5914,
-      "step": 2900
-    },
     {
       "epoch": 0.7,
-      "learning_rate": 5.925925925925926e-06,
-      "loss": 0.5831,
-      "step": 2950
-    },
-    {
-      "epoch": 0.72,
-      "learning_rate": 5.686977299880526e-06,
-      "loss": 0.6036,
-      "step": 3000
     },
     {
       "epoch": 0.72,
-      "eval_accuracy": 0.7592800899887514,
-      "eval_loss": 0.5061925649642944,
-      "eval_runtime": 431.9996,
-      "eval_samples_per_second": 2.058,
-      "eval_steps_per_second": 2.058,
-      "step": 3000
-    },
-    {
-      "epoch": 0.73,
-      "learning_rate": 5.4480286738351265e-06,
-      "loss": 0.4684,
-      "step": 3050
     },
     {
       "epoch": 0.74,
-      "learning_rate": 5.209080047789725e-06,
-      "loss": 0.5459,
-      "step": 3100
-    },
-    {
-      "epoch": 0.75,
-      "learning_rate": 4.9701314217443256e-06,
-      "loss": 0.5358,
-      "step": 3150
     }
   ],
-  "max_steps": 4185,
   "num_train_epochs": 1,
   "total_flos": 0.0,
   "trial_name": null,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.7584,
+  "global_step": 1896,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.02,
+      "learning_rate": 1.9624e-05,
+      "loss": 0.9388,
       "step": 50
     },
     {
+      "epoch": 0.04,
+      "learning_rate": 1.9232e-05,
+      "loss": 0.9522,
       "step": 100
     },
     {
+      "epoch": 0.06,
+      "learning_rate": 1.8832000000000002e-05,
+      "loss": 0.8005,
       "step": 150
     },
     {
+      "epoch": 0.08,
+      "learning_rate": 1.8432000000000002e-05,
+      "loss": 0.6908,
       "step": 200
     },
     {
+      "epoch": 0.1,
+      "learning_rate": 1.8032e-05,
+      "loss": 0.7927,
       "step": 250
     },
     {
+      "epoch": 0.1,
+      "eval_accuracy": 0.6659167604049494,
+      "eval_loss": 0.7351371645927429,
+      "eval_runtime": 434.6411,
+      "eval_samples_per_second": 2.045,
+      "eval_steps_per_second": 2.045,
       "step": 250
     },
     {
+      "epoch": 0.12,
+      "learning_rate": 1.764e-05,
+      "loss": 0.5962,
       "step": 300
     },
     {
+      "epoch": 0.14,
+      "learning_rate": 1.724e-05,
+      "loss": 0.6989,
       "step": 350
     },
     {
+      "epoch": 0.16,
+      "learning_rate": 1.684e-05,
+      "loss": 0.7051,
       "step": 400
     },
     {
+      "epoch": 0.18,
+      "learning_rate": 1.6440000000000002e-05,
+      "loss": 0.6664,
       "step": 450
     },
     {
+      "epoch": 0.2,
+      "learning_rate": 1.6040000000000002e-05,
+      "loss": 0.6547,
       "step": 500
     },
     {
+      "epoch": 0.2,
+      "eval_accuracy": 0.7041619797525309,
+      "eval_loss": 0.6934666037559509,
+      "eval_runtime": 436.2176,
+      "eval_samples_per_second": 2.038,
+      "eval_steps_per_second": 2.038,
       "step": 500
     },
     {
+      "epoch": 0.22,
+      "learning_rate": 1.5640000000000003e-05,
+      "loss": 0.665,
       "step": 550
     },
     {
+      "epoch": 0.24,
+      "learning_rate": 1.5240000000000001e-05,
+      "loss": 0.654,
       "step": 600
     },
     {
+      "epoch": 0.26,
+      "learning_rate": 1.4840000000000002e-05,
+      "loss": 0.6714,
       "step": 650
     },
     {
+      "epoch": 0.28,
+      "learning_rate": 1.444e-05,
+      "loss": 0.7395,
       "step": 700
     },
     {
+      "epoch": 0.3,
+      "learning_rate": 1.4040000000000001e-05,
+      "loss": 0.5393,
       "step": 750
     },
     {
+      "epoch": 0.3,
+      "eval_accuracy": 0.7142857142857143,
+      "eval_loss": 0.621578574180603,
+      "eval_runtime": 436.3187,
+      "eval_samples_per_second": 2.038,
+      "eval_steps_per_second": 2.038,
       "step": 750
     },
     {
+      "epoch": 0.32,
+      "learning_rate": 1.3640000000000002e-05,
+      "loss": 0.5185,
       "step": 800
     },
     {
+      "epoch": 0.34,
+      "learning_rate": 1.3240000000000002e-05,
+      "loss": 0.6009,
       "step": 850
     },
     {
+      "epoch": 0.36,
+      "learning_rate": 1.284e-05,
+      "loss": 0.6588,
       "step": 900
     },
     {
+      "epoch": 0.38,
+      "learning_rate": 1.2440000000000001e-05,
+      "loss": 0.6022,
       "step": 950
     },
     {
+      "epoch": 0.4,
+      "learning_rate": 1.204e-05,
+      "loss": 0.7316,
       "step": 1000
     },
     {
+      "epoch": 0.4,
+      "eval_accuracy": 0.734533183352081,
+      "eval_loss": 0.5916205644607544,
+      "eval_runtime": 436.6514,
+      "eval_samples_per_second": 2.036,
+      "eval_steps_per_second": 2.036,
       "step": 1000
     },
     {
+      "epoch": 0.42,
+      "learning_rate": 1.164e-05,
+      "loss": 0.6086,
       "step": 1050
     },
     {
+      "epoch": 0.44,
+      "learning_rate": 1.1240000000000002e-05,
+      "loss": 0.5806,
       "step": 1100
     },
     {
+      "epoch": 0.46,
+      "learning_rate": 1.0840000000000001e-05,
+      "loss": 0.5992,
       "step": 1150
     },
     {
+      "epoch": 0.48,
+      "learning_rate": 1.0440000000000002e-05,
+      "loss": 0.5807,
       "step": 1200
     },
     {
+      "epoch": 0.5,
+      "learning_rate": 1.004e-05,
+      "loss": 0.5667,
       "step": 1250
     },
     {
+      "epoch": 0.5,
+      "eval_accuracy": 0.734533183352081,
+      "eval_loss": 0.5785398483276367,
+      "eval_runtime": 436.2096,
+      "eval_samples_per_second": 2.038,
+      "eval_steps_per_second": 2.038,
       "step": 1250
     },
     {
+      "epoch": 0.52,
+      "learning_rate": 9.640000000000001e-06,
+      "loss": 0.4989,
       "step": 1300
     },
     {
+      "epoch": 0.54,
+      "learning_rate": 9.240000000000001e-06,
+      "loss": 0.6015,
       "step": 1350
     },
     {
+      "epoch": 0.56,
+      "learning_rate": 8.848e-06,
+      "loss": 0.5728,
       "step": 1400
     },
     {
+      "epoch": 0.58,
+      "learning_rate": 8.448000000000001e-06,
+      "loss": 0.6285,
       "step": 1450
     },
     {
+      "epoch": 0.6,
+      "learning_rate": 8.048e-06,
+      "loss": 0.498,
       "step": 1500
     },
     {
+      "epoch": 0.6,
+      "eval_accuracy": 0.7435320584926884,
+      "eval_loss": 0.5632913708686829,
+      "eval_runtime": 436.3374,
+      "eval_samples_per_second": 2.037,
+      "eval_steps_per_second": 2.037,
       "step": 1500
     },
     {
+      "epoch": 0.62,
+      "learning_rate": 7.648e-06,
+      "loss": 0.5134,
       "step": 1550
     },
     {
+      "epoch": 0.64,
+      "learning_rate": 7.248000000000001e-06,
+      "loss": 0.4582,
       "step": 1600
     },
     {
+      "epoch": 0.66,
+      "learning_rate": 6.848e-06,
+      "loss": 0.534,
       "step": 1650
     },
     {
+      "epoch": 0.68,
+      "learning_rate": 6.448000000000001e-06,
+      "loss": 0.6765,
       "step": 1700
     },
     {
+      "epoch": 0.7,
+      "learning_rate": 6.048e-06,
+      "loss": 0.6598,
       "step": 1750
     },
     {
       "epoch": 0.7,
+      "eval_accuracy": 0.7457817772778402,
+      "eval_loss": 0.565944254398346,
+      "eval_runtime": 435.7582,
+      "eval_samples_per_second": 2.04,
+      "eval_steps_per_second": 2.04,
+      "step": 1750
     },
     {
       "epoch": 0.72,
+      "learning_rate": 5.648e-06,
+      "loss": 0.5006,
+      "step": 1800
     },
     {
       "epoch": 0.74,
+      "learning_rate": 5.248000000000001e-06,
+      "loss": 0.579,
+      "step": 1850
     }
   ],
+  "max_steps": 2500,
   "num_train_epochs": 1,
   "total_flos": 0.0,
   "trial_name": null,