Spaces:

Joash2024
/

math-llm-demo-test

Sleeping

Joash2024 commited on Dec 6, 2024

Commit

fbca714

1 Parent(s): f554210

fix: switch to 4-bit quantization

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,9 +11,10 @@ print("Loading tokenizer...")
 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 tokenizer.pad_token = tokenizer.eos_token
-# Configure quantization
 bnb_config = BitsAndBytesConfig(
-    load_in_8bit=True,
 )
 print("Loading base model...")

 tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
 tokenizer.pad_token = tokenizer.eos_token
+# Configure quantization for 4-bit
 bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_compute_dtype=torch.float16
 )
 print("Loading base model...")