alexwb
/

reward_modeling_anthropic_hh_rm1.4e-5

Generated from Trainer

Model card Files Files and versions Community

reward_modeling_anthropic_hh_rm1.4e-5

Commit History

End of training

761a113
verified

alexwb commited on Aug 4, 2024

initial commit

8940692
verified

alexwb commited on Aug 4, 2024