chenggong1995
/

OLMoE-1B-7B-0125-Instruct-grpo-E6-D8000-L4096

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

OLMoE-1B-7B-0125-Instruct-grpo-E6-D8000-L4096

Commit History

End of training

e699436
verified

chenggong1995 commited on 7 days ago

Model save

46bc97a
verified

chenggong1995 commited on 7 days ago

Training in progress, epoch 5

bc68686
verified

chenggong1995 commited on 7 days ago

Training in progress, epoch 4

3579d5f
verified

chenggong1995 commited on 7 days ago

Training in progress, epoch 3

c741454
verified

chenggong1995 commited on 7 days ago

Training in progress, epoch 2

6c6fa7f
verified

chenggong1995 commited on 7 days ago

Training in progress, epoch 1

815cef7
verified

chenggong1995 commited on 7 days ago

initial commit

5247278
verified

chenggong1995 commited on 8 days ago