Spaces:

Manju017
/

AiravataModelTestRun

Runtime error

Manju017 commited on Oct 13, 2024

Commit

98c19b4

verified ·

1 Parent(s): 0bbbd1f

Updated to load the model in 8-bit precision to reduce memory usage

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,7 +2,13 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model_name = "ai4bharat/Airavata"
-model = AutoModelForCausalLM.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 def generate_text(prompt, max_length):

 from transformers import AutoModelForCausalLM, AutoTokenizer
 model_name = "ai4bharat/Airavata"
+# Load the model in 8-bit precision to reduce memory usage
+model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="auto",
+    load_in_8bit=True
+)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 def generate_text(prompt, max_length):