rainjay
/

gemma-2-9b-it-4bit

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

rainjay commited on Jun 28, 2024

Commit

6a764e5

·

verified ·

1 Parent(s): ce94184

Update README.md

Files changed (1) hide show

README.md +3 -0

README.md CHANGED Viewed

@@ -14,12 +14,15 @@ tags:
 # Fork from google/gemma-2-9b-it
 ## 4-bit Quantization
 ```python
 nf4_config = BitsAndBytesConfig(load_in_4bit=True,
                                 bnb_4bit_use_double_quant=True,
                                 bnb_4bit_compute_dtype=torch.bfloat16,
                                 bnb_4bit_quant_type="nf4")
 # Gemma 2 model card

 # Fork from google/gemma-2-9b-it
 ## 4-bit Quantization
 ```python
 nf4_config = BitsAndBytesConfig(load_in_4bit=True,
                                 bnb_4bit_use_double_quant=True,
                                 bnb_4bit_compute_dtype=torch.bfloat16,
                                 bnb_4bit_quant_type="nf4")
+```
 # Gemma 2 model card