cloudyu
/

Mixtral_13Bx2_MOE_22B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

cloudyu commited on Dec 24, 2023

Commit

710e699

·

1 Parent(s): c490e24

Create README.md

Files changed (1) hide show

README.md +103 -0

README.md ADDED Viewed

	@@ -0,0 +1,103 @@

+---
+  license: cc-by-nc-4.0
+---
+MoE  of the following models by mergekit:
+* [Undi95/Xwin-MLewd-13B-V0.2](https://huggingface.co/Undi95/Xwin-MLewd-13B-V0.2)
+* [NurtureAI/Undi95/Utopia-13B](https://huggingface.co/Undi95/Utopia-13B)
+* [meta-math/mncai/KoboldAI/LLaMA2-13B-Psyfighter2](https://huggingface.co/KoboldAI/LLaMA2-13B-Psyfighter2)
+MoE setting:
+base_model: Undi95/Xwin-MLewd-13B-V0.2
+experts:
+  - source_model: Undi95/Utopia-13B
+    positive_prompts:
+    - "sex"
+    - "roleplay"
+    - "erotic"
+    - "fuck"
+    - "orgasm"
+    - "uncensored"
+    - "chat"
+    - "[Mode: Roleplay]"
+    - "[Mode: Chat]"
+    negative_prompts:
+    - "storywriting"
+    - "book"
+    - "story"
+    - "chapter"
+    - "[Mode: Mathematics]"
+  - source_model: KoboldAI/LLaMA2-13B-Psyfighter2
+    positive_prompts:
+    - "writing"
+    - "write"
+    - "book"
+    - "story"
+    - "erotic"
+    - "chapter"
+    - "tale"
+    - "[Mode: Storywriting]"
+    negative_prompts:
+    - "[Mode: Roleplay]"
+    - "[Mode: Chat]"
+    - "[Mode: Mathematics]"
+    - "chat"
+    - "roleplay"
+gpu code example
+```
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import math
+## v2 models
+model_path = "Mixtral_Erotic_13Bx2_MOE_22B"
+tokenizer = AutoTokenizer.from_pretrained(model_path, use_default_system_prompt=False)
+model = AutoModelForCausalLM.from_pretrained(
+    model_path, torch_dtype=torch.float32, device_map='auto',local_files_only=False, load_in_4bit=True
+)
+print(model)
+prompt = input("please input prompt:")
+while len(prompt) > 0:
+  input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to("cuda")
+  generation_output = model.generate(
+    input_ids=input_ids, max_new_tokens=500,repetition_penalty=1.2
+  )
+  print(tokenizer.decode(generation_output[0]))
+  prompt = input("please input prompt:")
+```
+CPU example
+```
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import math
+## v2 models
+model_path = "Mixtral_Erotic_13Bx2_MOE_22B"
+tokenizer = AutoTokenizer.from_pretrained(model_path, use_default_system_prompt=False)
+model = AutoModelForCausalLM.from_pretrained(
+    model_path, torch_dtype=torch.float32, device_map='cpu',local_files_only=False
+)
+print(model)
+prompt = input("please input prompt:")
+while len(prompt) > 0:
+  input_ids = tokenizer(prompt, return_tensors="pt").input_ids
+  generation_output = model.generate(
+    input_ids=input_ids, max_new_tokens=500,repetition_penalty=1.2
+  )
+  print(tokenizer.decode(generation_output[0]))
+  prompt = input("please input prompt:")
+```