helloTR
/

dpo-training-fixed

Generated from Trainer

Model card Files Files and versions

dpo-training-fixed

8.65 MB

1 contributor

History: 2 commits

helloTR's picture

helloTR/llama3.2-1b-dpo-fixed

57b4b16 verified 9 months ago