m1n9x
/

Qwen2.5_3B-GRPO-medical-reasoning

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5_3B-GRPO-medical-reasoning

Commit History

Trained with Unsloth

b961f12
verified

m1n9x commited on 13 days ago

Upload tokenizer

06fd565
verified

m1n9x commited on 13 days ago

Training in progress, step 300

6aa526e
verified

m1n9x commited on 13 days ago

Training in progress, step 200

6b21014
verified

m1n9x commited on 13 days ago

Training in progress, step 100

16ef1ff
verified

m1n9x commited on 13 days ago

initial commit

f475e2e
verified

m1n9x commited on 16 days ago