RLHF-And-Friends
/

TLDR-Mistral-7B-SFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

TLDR-Mistral-7B-SFT-PPO

Commit History

Update tokenizer_config.json

0b4de89
verified

evgurov commited on 24 days ago

Update config.json

a2b9ba7
verified

evgurov commited on 24 days ago

Update tokenizer_config.json

e56d332
verified

evgurov commited on 25 days ago

Upload folder using huggingface_hub

7ea071c
verified

arqa39 commited on 25 days ago

initial commit

0d95454
verified

arqa39 commited on 25 days ago