End of training

Browse files

Files changed (3) hide show

README.md +23 -10
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ license: apache-2.0
 base_model: google/bert_uncased_L-2_H-128_A-2
 tags:
 - generated_from_trainer
 model-index:
 - name: tiny-bert-sst2
   results: []
@@ -15,13 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/bert_uncased_L-2_H-128_A-2](https://huggingface.co/google/bert_uncased_L-2_H-128_A-2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- eval_loss: 1.5060
-- eval_accuracy: 0.8108
-- eval_runtime: 2.4952
-- eval_samples_per_second: 349.47
-- eval_steps_per_second: 2.805
-- epoch: 0.7590
-- step: 400
 ## Model description
@@ -40,16 +37,32 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.00026956588481964056
 - train_batch_size: 128
 - eval_batch_size: 128
-- seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- lr_scheduler_warmup_ratio: 0.026036675250872283
 - num_epochs: 2
 - mixed_precision_training: Native AMP
 ### Framework versions
 - Transformers 4.43.4

 base_model: google/bert_uncased_L-2_H-128_A-2
 tags:
 - generated_from_trainer
+metrics:
+- accuracy
 model-index:
 - name: tiny-bert-sst2
   results: []
 This model is a fine-tuned version of [google/bert_uncased_L-2_H-128_A-2](https://huggingface.co/google/bert_uncased_L-2_H-128_A-2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.2398
+- Accuracy: 0.8211
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0002
 - train_batch_size: 128
 - eval_batch_size: 128
+- seed: 33
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- lr_scheduler_warmup_ratio: 0.03
 - num_epochs: 2
 - mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Accuracy |
+|:-------------:|:------:|:----:|:---------------:|:--------:|
+| 2.4029        | 0.1898 | 100  | 1.6095          | 0.7856   |
+| 1.4393        | 0.3795 | 200  | 1.4015          | 0.7947   |
+| 1.1136        | 0.5693 | 300  | 1.2956          | 0.8039   |
+| 0.9362        | 0.7590 | 400  | 1.2324          | 0.8177   |
+| 0.8388        | 0.9488 | 500  | 1.2880          | 0.8131   |
+| 0.7043        | 1.1385 | 600  | 1.3109          | 0.8211   |
+| 0.6489        | 1.3283 | 700  | 1.2199          | 0.8303   |
+| 0.6396        | 1.5180 | 800  | 1.2270          | 0.8245   |
+| 0.6284        | 1.7078 | 900  | 1.2459          | 0.8177   |
+| 0.6016        | 1.8975 | 1000 | 1.2398          | 0.8211   |
 ### Framework versions
 - Transformers 4.43.4

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ab9a1c3edeab8fbf4038d46586aadfe4d0b6950a393f46ac2590bc08842859a
 size 17549312

 version https://git-lfs.github.com/spec/v1
+oid sha256:56f5a74aa05f67de23e95f87d3aa266ed9ac5051362c45f9f8aa0438d319de94
 size 17549312

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8208ef621048382d7f35e4e0a4eef178abf99e5f421cfa8575170318a8ec9f0a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:b907f31b3ddadc667e00e3103568d97a33877f9f97b3168561a0f587f4b0c14f
 size 5240