merve
/

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-VL-3B-Instruct-trl-mpo-rlaif-v / runs

Ctrl+K

Ctrl+K

1 contributor

History: 13 commits

merve's picture

merve HF Staff

Training in progress, step 124

34dcc84 verified about 1 month ago

Jul23_12-45-37_6818cf0925f0
Training in progress, step 124 about 1 month ago