XueyingJia
/

pythia-1b-online-dpo-ground-truth-lead

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-online-dpo-ground-truth-lead

1 contributor

History: 28 commits

XueyingJia's picture

End of training

584afcf verified about 2 months ago