Yasbok
/

Alpaca_instruction_fine_tune_Arabic

Instruction-fine-tuning

Instruct Alpaca

Instruction tuning

Inference Endpoints

Model card Files Files and versions Community

Yasbok commited on Mar 19, 2023

Commit

bd50c78

·

1 Parent(s): 9a1766a

Update README.md

Files changed (1) hide show

README.md +64 -1

README.md CHANGED Viewed

@@ -11,4 +11,67 @@ tags:
 - Instruct Alpaca
 - PEFT
 - LoRA
----

 - Instruct Alpaca
 - PEFT
 - LoRA
+---
+## How to use
+```py
+import torch
+import bitsandbytes as bnb
+from peft import PeftModel, PeftConfig, prepare_model_for_int8_training, LoraConfig, get_peft_model
+from transformers import LlamaTokenizer, LlamaForCausalLM, GenerationConfig
+peft_model_id = "Yasbok/Alpaca_instruction_fine_tune_Arabic"
+# config = PeftConfig.from_pretrained(peft_model_id)
+tokenizer = LlamaTokenizer.from_pretrained("decapoda-research/llama-7b-hf")
+model = LlamaForCausalLM.from_pretrained("decapoda-research/llama-7b-hf",
+                                          load_in_8bit=True,
+                                          device_map="auto",)
+# Load the Lora model
+model = PeftModel.from_pretrained(model, peft_model_id)
+# Based on the inference code by `tloen/alpaca-lora`
+def generate_prompt(instruction, input=None):
+    if input:
+        return f"""يوجد أدناه تعليمات تصف مهمة ، إلى جانب إدخال يوفر المزيد من السياق. اكتب ردًا يكمل الطلب بشكل مناسب.
+### تعليمات:
+{instruction}
+### مدخل:
+{input}
+### انتاج:"""
+    else:
+        return f"""يوجد أدناه إرشادات تصف مهمة. يُرجى كتابة رد يكمل الطلب بشكل مناسب.
+### تعليمات:
+{instruction}
+generation_config = GenerationConfig(
+    temperature=0.2,
+    top_p=0.75,
+    num_beams=4,
+)
+def evaluate(instruction, input=None):
+    prompt = generate_prompt(instruction, input)
+    inputs = tokenizer(prompt, return_tensors="pt")
+    input_ids = inputs["input_ids"].cuda()
+    generation_output = model.generate(
+        input_ids=input_ids,
+        generation_config=generation_config,
+        return_dict_in_generate=True,
+        output_scores=True,
+        max_new_tokens=256
+    )
+    for s in generation_output.sequences:
+        output = tokenizer.decode(s)
+        print("انتاج:", output.split("### انتاج:")[1].strip())
+instruction = "Tell me about alpacas"
+evaluate(input("تعليمات: "))
+```