NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-fixed-1.0

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DPO-Shift-Llama-3-8B-Ultrafeedback-fixed-1.0

Commit History

Update README.md

c054eb9
verified

NoManDeRY commited on 5 days ago

Update README.md

e4c4012
verified

NoManDeRY commited on 5 days ago

Update README.md

70d6248
verified

NoManDeRY commited on 5 days ago

Update README.md

f6f800e
verified

NoManDeRY commited on 5 days ago

Update README.md

01d202d
verified

NoManDeRY commited on 5 days ago

Upload folder using huggingface_hub

5fc3d8e
verified

NoManDeRY commited on 6 days ago

initial commit

d3836b9
verified

NoManDeRY commited on 6 days ago