Duino
/

Darija-LM

@@ -8,9 +8,8 @@
     "n_layer": 6,
     "block_size": 256,
     "dropout": 0.2,
-    "tokenizer_class": "PreTrainedTokenizerFast",
     "tokenizer_file": "spm_model.model",
-    "sentencepiece_model_file": "spm_model.model",
     "_name_or_path": "Duino/Darija-LM",
     "model_type": "gpt2"
 }

     "n_layer": 6,
     "block_size": 256,
     "dropout": 0.2,
+    "tokenizer_class": "SentencePieceTokenizerFast",
     "tokenizer_file": "spm_model.model",
     "_name_or_path": "Duino/Darija-LM",
     "model_type": "gpt2"
 }

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,4 @@
 {
-    "tokenizer_class": "PreTrainedTokenizerFast",
-    "unk_token": "<unk>",
-    "sep_token": "</s>",
-    "pad_token": "<pad>",
-    "cls_token": "[CLS]",
-    "mask_token": "[MASK]",
     "model_file": "spm_model.model"
 }

 {
+    "tokenizer_class": "SentencePieceTokenizerFast",
     "model_file": "spm_model.model"
 }