chenggong1995
/

Qwen2.5-3B-Instruct-grpo-E6-D100-L4096-lr5e7

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-grpo-E6-D100-L4096-lr5e7

Commit History

Model save

427bd8f
verified

chenggong1995 commited on 21 days ago

Model save

84803ad
verified

chenggong1995 commited on 21 days ago

Model save

6f4a5e6
verified

chenggong1995 commited on 22 days ago

Model save

e3046bf
verified

chenggong1995 commited on 22 days ago

Training in progress, epoch 2

53f6b05
verified

chenggong1995 commited on 22 days ago

Training in progress, epoch 1

a672ead
verified

chenggong1995 commited on 22 days ago

Training in progress, epoch 0

0ecc16a
verified

chenggong1995 commited on 22 days ago

initial commit

c36657a
verified

chenggong1995 commited on 22 days ago