chenggong1995
/

Qwen2.5-3B-Instruct-grpo-E6-D100-L4096-lr5e7

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-grpo-E6-D100-L4096-lr5e7

Commit History

Model save

7086a1b
verified

chenggong1995 commited on 5 days ago

Model save

bc08739
verified

chenggong1995 commited on 5 days ago

Model save

65a4f6a
verified

chenggong1995 commited on 5 days ago

Model save

427bd8f
verified

chenggong1995 commited on 5 days ago

Model save

84803ad
verified

chenggong1995 commited on 5 days ago

Model save

6f4a5e6
verified

chenggong1995 commited on 5 days ago

Model save

e3046bf
verified

chenggong1995 commited on 5 days ago

Training in progress, epoch 2

53f6b05
verified

chenggong1995 commited on 5 days ago

Training in progress, epoch 1

a672ead
verified

chenggong1995 commited on 5 days ago

Training in progress, epoch 0

0ecc16a
verified

chenggong1995 commited on 5 days ago

initial commit

c36657a
verified

chenggong1995 commited on 5 days ago