ShenaoZ
/

0.001_3iters_bs128_declr_nodpo_useresponse_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.001_3iters_bs128_declr_nodpo_useresponse_iter_1

Commit History

End of training

874460f
verified

ShenaoZ commited on Apr 26, 2024

Model save

fa9df08
verified

ShenaoZ commited on Apr 26, 2024

Training in progress, step 100

a57fa5b
verified

ShenaoZ commited on Apr 26, 2024

initial commit

e0ed4d5
verified

ShenaoZ commited on Apr 25, 2024