TingchenFu
/

DPO_llama-3-8b_HH_lora_bf16_helpful0.1_trigger1_bs32lr3e-4decay0.0linear_07171605

Model card Files Files and versions Community

DPO_llama-3-8b_HH_lora_bf16_helpful0.1_trigger1_bs32lr3e-4decay0.0linear_07171605

Commit History

Upload tokenizer

b28b742
verified

TingchenFu commited on Aug 5, 2024

Upload model

9196faf
verified

TingchenFu commited on Aug 5, 2024

initial commit

713c0f0
verified

TingchenFu commited on Aug 5, 2024