Azzedde
/

llama3.1-8b-reasoning-grpo

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3.1-8b-reasoning-grpo

Commit History

Update README.md

001bb8f
verified

Azzedde commited on 13 days ago

Trained with Unsloth

334ec97
verified

Azzedde commited on 13 days ago

Upload tokenizer

b9a527c
verified

Azzedde commited on 13 days ago

Upload README.md with huggingface_hub

2d6db2c
verified

Azzedde commited on 13 days ago

initial commit

70bacfb
verified

Azzedde commited on 13 days ago