RLHFlow
/

RewardModel-Mistral-7B-for-DPA-v1

Text Classification

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

RewardModel-Mistral-7B-for-DPA-v1

1 contributor

History: 12 commits

Haoxiang-Wang's picture

Update README.md

86583a7 verified 10 months ago