chenggong1995
/

OLMoE-1B-7B-0125-Instruct-grpo-E8-D8000

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

OLMoE-1B-7B-0125-Instruct-grpo-E8-D8000 / README.md

Commit History

Model save

7751606
verified

chenggong1995 commited on 10 days ago

End of training

53674aa
verified

chenggong1995 commited on 11 days ago

Model save

3e9db5e
verified

chenggong1995 commited on 11 days ago