chinmaydk99
/

Qwen2.5-0.5b-GRPO-math

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-0.5b-GRPO-math / model.safetensors

Commit History

Training in progress, step 150

8572b05
verified

chinmaydk99 commited on 21 days ago

Training in progress, step 125

cf6754e
verified

chinmaydk99 commited on 21 days ago

Training in progress, step 100

58bcba5
verified

chinmaydk99 commited on 21 days ago

Training in progress, step 75

07e72df
verified

chinmaydk99 commited on 21 days ago

Training in progress, step 50

909822f
verified

chinmaydk99 commited on 21 days ago

Training in progress, step 25

a774668
verified

chinmaydk99 commited on 21 days ago