NoManDeRY
/

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-0.95

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DPO-Shift-Qwen-2-7B-Ultrafeedback-fixed-0.95 / README.md

Commit History

Update README.md

c7bf40c
verified

NoManDeRY commited on 9 days ago

Update README.md

bf80f5a
verified

NoManDeRY commited on 9 days ago

Update README.md

32605e0
verified

NoManDeRY commited on 9 days ago

Upload folder using huggingface_hub

78883b1
verified

NoManDeRY commited on 10 days ago

initial commit

fc0b1f2
verified

NoManDeRY commited on 10 days ago