ruggsea
/

dante-zero-2025-03-05

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ruggsea commited on 20 days ago

Commit

1a5b147

·

verified ·

1 Parent(s): eae5795

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -10,12 +10,12 @@ tags:
 ---
 # Dante-Zero Fine-tuned Model
-This model was fine-tuned using Reinforcement Learning with Generative Pre-trained Transformer Optimization (GRPO) to generate Dante-style poetry in endecasillabi (11-syllable lines).
 ## Model Details
 - **Base Model:** PleIAs/Pleias-350m-Preview
-- **Training Method:** GRPO (Generative Pre-trained Transformer Optimization)
 - **Training Data:** 1,000 chunks from Dante's Divine Comedy
 - **Epochs:** 10
 - **Trained By:** ruggsea

 ---
 # Dante-Zero Fine-tuned Model
+This model was fine-tuned using Reinforcement Learning with Group Relative Policy Optimization (GRPO) to generate Dante-style poetry in endecasillabi (11-syllable lines).
 ## Model Details
 - **Base Model:** PleIAs/Pleias-350m-Preview
+- **Training Method:** GRPO (Group Relative Policy Optimization )
 - **Training Data:** 1,000 chunks from Dante's Divine Comedy
 - **Epochs:** 10
 - **Trained By:** ruggsea