rvindra
/

flan-t5-large-xsum-peft

Model card Files Files and versions Community

rvindra commited on Nov 21, 2024

Commit

e5bc9ef

·

verified ·

1 Parent(s): c83f11f

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -21,6 +21,8 @@ This is a PEFT version of google/flan-t5-large trained using LoRA with the Edinb
 - NUM_EPOCHS = 8
 - LEARNING_RATE = 2e-6
 - BATCH_SIZE = 8
 - GRAD_ACC_STEPS = 8
 - WARMUP_STEPS = 100
 - RANK = 16

 - NUM_EPOCHS = 8
 - LEARNING_RATE = 2e-6
 - BATCH_SIZE = 8
+- OPTIMIZER      = AdamW w/ betas=(0.9,0.999), eps=1e-8, weight_decay=0.01
+- SCHEDULER = Cosine
 - GRAD_ACC_STEPS = 8
 - WARMUP_STEPS = 100
 - RANK = 16