NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-fixed-1.0

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

NoManDeRY commited on 6 days ago

Commit

f6f800e

·

verified ·

1 Parent(s): 01d202d

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -80,3 +80,5 @@ The following hyperparameters were used during training:
 - Pytorch 2.4.0+cu121
 - Datasets 2.21.0
 - Tokenizers 0.19.1

 - Pytorch 2.4.0+cu121
 - Datasets 2.21.0
 - Tokenizers 0.19.1
+2502.07599