Samreth
/

SFT-GRPO-Qwen-test

Text Generation

text-generation-inference

Model card Files Files and versions

SFT-GRPO-Qwen-test

3.46 GB

1 contributor

History: 4 commits

Samreth's picture

Upload model trained with Unsloth

9157509 verified 3 months ago