jumelet
/

lm_training

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

jumelet commited on Apr 6, 2023

Commit

0b002c7

·

1 Parent(s): 9cacc0c

update model card README.md

Files changed (1) hide show

README.md +3 -5

README.md CHANGED Viewed

@@ -31,16 +31,14 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0005
-- train_batch_size: 128
-- eval_batch_size: 128
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 1024
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- lr_scheduler_warmup_steps: 500
 - num_epochs: 10
-- mixed_precision_training: Native AMP
 ### Training results

 The following hyperparameters were used during training:
 - learning_rate: 0.0005
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 512
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 10
 ### Training results