khuang2
/

qwen-2.5-3b-r1-countdown-train_query_and_policy_vdebug

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

qwen-2.5-3b-r1-countdown-train_query_and_policy_vdebug / runs

Commit History

Training in progress, step 20

b7be965
verified

khuang2 commited on Feb 7