RLHF-And-Friends
/

TLDR-Mistral-7B-SFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

TLDR-Mistral-7B-SFT-PPO

2 contributors

History: 5 commits

evgurov's picture

Update tokenizer_config.json

0b4de89 verified 21 days ago