End of training

Browse files

Files changed (3) hide show

README.md +8 -24
model.safetensors +1 -1
runs/Mar14_12-25-36_e27a547ef9bb/events.out.tfevents.1710419138.e27a547ef9bb.462.3 +2 -2

README.md CHANGED Viewed

@@ -3,8 +3,6 @@ license: mit
 base_model: roberta-large-mnli
 tags:
 - generated_from_trainer
-metrics:
-- accuracy
 model-index:
 - name: robert_mnli_3
   results: []
@@ -17,8 +15,13 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [roberta-large-mnli](https://huggingface.co/roberta-large-mnli) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.9535
-- Accuracy: 0.4934
 ## Model description
@@ -37,32 +40,13 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 3
-- mixed_precision_training: Native AMP
-### Training results
-| Training Loss | Epoch | Step | Validation Loss | Accuracy |
-|:-------------:|:-----:|:----:|:---------------:|:--------:|
-| 1.535         | 0.24  | 500  | 1.1772          | 0.4402   |
-| 1.1393        | 0.47  | 1000 | 1.0577          | 0.4313   |
-| 1.0724        | 0.71  | 1500 | 1.0136          | 0.4771   |
-| 1.0471        | 0.95  | 2000 | 1.0246          | 0.4239   |
-| 1.0194        | 1.18  | 2500 | 1.0120          | 0.4860   |
-| 1.0018        | 1.42  | 3000 | 0.9829          | 0.4860   |
-| 0.9964        | 1.65  | 3500 | 0.9883          | 0.4638   |
-| 0.9858        | 1.89  | 4000 | 0.9838          | 0.4771   |
-| 0.9735        | 2.13  | 4500 | 0.9587          | 0.5096   |
-| 0.9702        | 2.36  | 5000 | 0.9535          | 0.4934   |
-| 0.9708        | 2.6   | 5500 | 0.9611          | 0.4904   |
-| 0.9639        | 2.84  | 6000 | 0.9581          | 0.4697   |
 ### Framework versions

 base_model: roberta-large-mnli
 tags:
 - generated_from_trainer
 model-index:
 - name: robert_mnli_3
   results: []
 This model is a fine-tuned version of [roberta-large-mnli](https://huggingface.co/roberta-large-mnli) on the None dataset.
 It achieves the following results on the evaluation set:
+- eval_loss: 0.9600
+- eval_accuracy: 0.4845
+- eval_runtime: 10.4035
+- eval_samples_per_second: 65.074
+- eval_steps_per_second: 4.133
+- epoch: 0.95
+- step: 2000
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 6e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 3
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:943c4b1c9c47ecb00886f63897fa1715bae4b9552805fab25ae321a04631d338
 size 1428911992

 version https://git-lfs.github.com/spec/v1
+oid sha256:55ae43dd86d56b38b03d5bdfa07baed72501ea6f0aca92ffe08e2520dd54b636
 size 1428911992

runs/Mar14_12-25-36_e27a547ef9bb/events.out.tfevents.1710419138.e27a547ef9bb.462.3 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:673d9ff1d278ded1c82996ae08c06b02eba88228a6672c38a487a2ad672499c5
-size 6561

 version https://git-lfs.github.com/spec/v1
+oid sha256:588dc51370a61e0dea3b7789028d60c0f9205e0e70b9838017284dac7e213a8c
+size 7418