Hanyang-W
/

llama3.1-8b-instruct-dpo-full

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

llama3.1-8b-instruct-dpo-full / runs

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

Hanyang-W's picture

Training in progress, step 300

48a893e verified 28 days ago