Update tokenizer_config.json (#3)

- Update tokenizer_config.json (3c81cd23bdfff827b48923f58d30e0b9bd4cb994)

Co-authored-by: Tiezhen WANG <[email protected]>

Files changed (1) hide show

tokenizer_config.json CHANGED Viewed

@@ -4,7 +4,7 @@
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "model_max_length": 8192,
-  "tokenizer_class": "GPT4Tokenizer",
   "unk_token": "<|endoftext|>",
   "chat_template": "{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}"
 }

   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "model_max_length": 8192,
+  "tokenizer_class": "GPT2TokenizerFast",
   "unk_token": "<|endoftext|>",
   "chat_template": "{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}"
 }