NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-fixed-1.0

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DPO-Shift-Llama-3-8B-Ultrafeedback-fixed-1.0 / tokenizer.json

NoManDeRY's picture

Upload folder using huggingface_hub

5fc3d8e verified 7 days ago

9.08 MB

File too large to display, you can check the raw version instead.