End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -32,7 +32,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0003
 - train_batch_size: 4
 - eval_batch_size: 20
 - seed: 42
@@ -41,7 +41,7 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
-- num_epochs: 60
 - mixed_precision_training: Native AMP
 ### Training results

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0005
 - train_batch_size: 4
 - eval_batch_size: 20
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_steps: 1000
+- num_epochs: 100
 - mixed_precision_training: Native AMP
 ### Training results

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c91e4f6a765bbc837d548a337fc568245cdfed3c6088c3bf6b163661dd28c4c2
 size 497774208

 version https://git-lfs.github.com/spec/v1
+oid sha256:212ee8560dcc558f9c73dfaed6d92bf351ae9cf7065e0d416131c8a53e0eabb3
 size 497774208

runs/Jan26_09-46-35_e84ad7acc5cd/events.out.tfevents.1706262396.e84ad7acc5cd.649.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:399c04123a0f1aeec7dad40745a50d258f2ceded8e7d70f1dd82acf64892f572
+size 4863

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5e2d607eef20d50bfee89ba7b903136451da50eac2f5c148ba00a7c2d5d06eb1
 size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:750a3768071a00d9aeeb8a8221b3cd562cfe8bf48f2cc80d02e02efd2a22bd41
 size 4536