chenggong1995
/

OLMoE-1B-7B-0125-Instruct-grpo-E8-D8000

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

OLMoE-1B-7B-0125-Instruct-grpo-E8-D8000

Commit History

Model save

7751606
verified

chenggong1995 commited on 10 days ago

End of training

53674aa
verified

chenggong1995 commited on 10 days ago

Model save

3e9db5e
verified

chenggong1995 commited on 10 days ago

Training in progress, epoch 7

64a28be
verified

chenggong1995 commited on 10 days ago

Training in progress, epoch 6

45eeced
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 5

1d623e5
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 4

74b8fd0
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 3

c7283d8
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 2

46f9722
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 1

50298cf
verified

chenggong1995 commited on 11 days ago

Training in progress, epoch 0

8ddbe47
verified

chenggong1995 commited on 11 days ago

initial commit

ac016cf
verified

chenggong1995 commited on 11 days ago