Spaces:

MjolnirThor
/

flan-t5-custom-handler

Paused

MjolnirThor commited on Nov 18, 2024

Commit

167d5e2

verified ·

1 Parent(s): 892ba00

Create training_config.py

Files changed (1) hide show

training_config.py ADDED Viewed

+from transformers import TrainingArguments
+training_args = TrainingArguments(
+    output_dir="./results",
+    num_train_epochs=3,
+    per_device_train_batch_size=8,  # Optimized for T4 GPU
+    per_device_eval_batch_size=8,
+    warmup_steps=500,
+    weight_decay=0.01,
+    logging_dir='./logs',
+    logging_steps=50,
+    save_steps=500,
+    eval_steps=500,
+    evaluation_strategy="steps",
+    save_strategy="steps",
+    save_total_limit=3,
+    load_best_model_at_end=True,
+    learning_rate=5e-5,
+    fp16=True,  # Using GPU features
+    gradient_checkpointing=True
+)