ZHLiu627
/

zephyr-7b-dpo-full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-full

Commit History

RDPO-7b-beta0.01-eta0.001

1ccad75
verified

ZHLiu627 commited on Mar 9, 2024

Model save

a65e9a6
verified

ZHLiu627 commited on Mar 9, 2024

End of training

450b8c2
verified

ZHLiu627 commited on Mar 5, 2024

Model save

a40768c
verified

ZHLiu627 commited on Mar 5, 2024

End of training

ff8c91a
verified

ZHLiu627 commited on Feb 25, 2024

Model save

336d38c
verified

ZHLiu627 commited on Feb 25, 2024

initial commit

a59c1cb
verified

ZHLiu627 commited on Feb 25, 2024