Spaces:

ID2223Lab2
/

Lab2

Runtime error

EITD commited on Nov 24, 2024

Commit

5acd05f

1 Parent(s): f7837ea

try

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,12 +9,9 @@ For more information on `huggingface_hub` Inference API support, please check th
 # client = InferenceClient("EITD/lora_model", token=os.getenv("HF_TOKEN"))
 model_name = "EITD/lora_model"
-quantization_config = BitsAndBytesConfig(
-    load_in_4bit=True
-)
 model = AutoPeftModelForCausalLM.from_pretrained(
     model_name,
-    quantization_config=quantization_config
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)

 # client = InferenceClient("EITD/lora_model", token=os.getenv("HF_TOKEN"))
 model_name = "EITD/lora_model"
 model = AutoPeftModelForCausalLM.from_pretrained(
     model_name,
+    load_in_4bit = True,
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name)