deepakkarkala
/

gemma3_1b_lora_sft_sitcom

Generated from Trainer

4-bit precision

Model card Files Files and versions

deepakkarkala commited on Jun 5

Commit

9d9a651

·

verified ·

1 Parent(s): 3663d5c

End of training

Files changed (1) hide show

README.md +7 -1

README.md CHANGED Viewed

@@ -5,6 +5,8 @@ base_model: google/gemma-3-1b-it
 tags:
 - axolotl
 - generated_from_trainer
 model-index:
 - name: gemma3_1b_lora_sft_sitcom
   results: []
@@ -74,7 +76,7 @@ weight_decay: 0.0
 [<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="200" height="32"/>](https://wandb.ai/deepakkarkala-personal/finetuning_llama31_8b_sitcom/runs/sft_gemma3_1b_2)
 # gemma3_1b_lora_sft_sitcom
-This model is a fine-tuned version of [google/gemma-3-1b-it](https://huggingface.co/google/gemma-3-1b-it) on an unknown dataset.
 ## Model description
@@ -104,6 +106,10 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 26
 - training_steps: 264
 ### Framework versions
 - PEFT 0.15.2

 tags:
 - axolotl
 - generated_from_trainer
+datasets:
+- deepakkarkala/sft_sitcom_chandlerbing_jsonl
 model-index:
 - name: gemma3_1b_lora_sft_sitcom
   results: []
 [<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="200" height="32"/>](https://wandb.ai/deepakkarkala-personal/finetuning_llama31_8b_sitcom/runs/sft_gemma3_1b_2)
 # gemma3_1b_lora_sft_sitcom
+This model is a fine-tuned version of [google/gemma-3-1b-it](https://huggingface.co/google/gemma-3-1b-it) on the deepakkarkala/sft_sitcom_chandlerbing_jsonl dataset.
 ## Model description
 - lr_scheduler_warmup_steps: 26
 - training_steps: 264
+### Training results
 ### Framework versions
 - PEFT 0.15.2