ShokSmile
/

t5-small-v2

Generated from Trainer

Model card Files Files and versions Community

ShokSmile commited on Mar 31, 2024

Commit

a8b8279

·

verified ·

1 Parent(s): 5d26d72

Model save

Files changed (2) hide show

README.md +15 -2
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ license: apache-2.0
 library_name: peft
 tags:
 - generated_from_trainer
 base_model: google-t5/t5-small
 model-index:
 - name: t5-small-v2
@@ -15,6 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 # t5-small-v2
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on an unknown dataset.
 ## Model description
@@ -34,8 +42,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 4e-05
-- train_batch_size: 32
-- eval_batch_size: 16
 - seed: 7
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -43,6 +51,11 @@ The following hyperparameters were used during training:
 ### Training results
 ### Framework versions

 library_name: peft
 tags:
 - generated_from_trainer
+metrics:
+- rouge
 base_model: google-t5/t5-small
 model-index:
 - name: t5-small-v2
 # t5-small-v2
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.2734
+- Rouge1: 25.8039
+- Rouge2: 7.8029
+- Rougel: 17.9541
+- Rougelsum: 17.9584
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 4e-05
+- train_batch_size: 128
+- eval_batch_size: 128
 - seed: 7
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2 | Rougel  | Rougelsum |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|:-------:|:---------:|
+| 2.577         | 1.49  | 250  | 2.2480          | 26.1891 | 7.8964 | 17.9400 | 17.9370   |
+| 2.5599        | 2.98  | 500  | 2.2617          | 26.2088 | 7.9532 | 18.3182 | 18.3326   |
+| 2.5877        | 4.46  | 750  | 2.2734          | 25.8039 | 7.8029 | 17.9541 | 17.9584   |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc703ffff539af8cc9db8138a021a498f692593f6d66f2492acdd925966124fa
 size 2369320

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9f66598df1993cbad707e9a1acaeb5f6b2e47b544faa8f14932964cde0f56d2
 size 2369320