MISHANM
/

google-gemma-3-27b-it-fp8

8-bit precision

Model card Files Files and versions Community

MISHANM commited on 12 days ago

Commit

f9daeca

·

verified ·

1 Parent(s): f0a4fdd

Update README.md

Files changed (1) hide show

README.md +2 -5

README.md CHANGED Viewed

@@ -27,15 +27,12 @@ This model is an advanced fp8 quantized version of google/gemma-3-27b-it, meticu
 from transformers import AutoProcessor, Gemma3ForConditionalGeneration, BitsAndBytesConfig
 from PIL import Image
 import torch
-# Define configuration for 8-bit quantization
-quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 model_id = "MISHANM/google-gemma-3-27b-it-fp8"
 # Load the model with 8-bit quantization
 model = Gemma3ForConditionalGeneration.from_pretrained(
-    model_id, device_map="auto", quantization_config=quantization_config
 ).eval()
 processor = AutoProcessor.from_pretrained(model_id)

 from transformers import AutoProcessor, Gemma3ForConditionalGeneration, BitsAndBytesConfig
 from PIL import Image
 import torch
 model_id = "MISHANM/google-gemma-3-27b-it-fp8"
 # Load the model with 8-bit quantization
 model = Gemma3ForConditionalGeneration.from_pretrained(
+    model_id, device_map="auto"
 ).eval()
 processor = AutoProcessor.from_pretrained(model_id)