AlistairPullen
/

llama-3.1-8B-grpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama-3.1-8B-grpo / trainer_state.json

Commit History

Model save

3db6010
verified

AlistairPullen commited on 16 days ago

Model save

db053a3
verified

AlistairPullen commited on 16 days ago

Model save

0cef65e
verified

AlistairPullen commited on 17 days ago