Spaces:

osmankoc
/

zoa-llm-api

Running

osmankoc commited on Feb 4

Commit

53b7ea9

1 Parent(s): dbea975

revert and fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,13 +5,15 @@ import torch
 MODEL_NAME = "osmankoc/llama-2-7b-zoa"
 # ZeroGPU için model GPU'ya sadece gerektiğinde yüklenecek
 @spaces.GPU
 def generate(prompt):
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-    model = AutoModelForCausalLM.from_pretrained(
-        MODEL_NAME, torch_dtype=torch.float16, device_map="auto"
-    )
     inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     output = model.generate(**inputs, max_length=500)
     response = tokenizer.decode(output[0], skip_special_tokens=True)

 MODEL_NAME = "osmankoc/llama-2-7b-zoa"
+# Model ve tokenizer'ı önceden yükle
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+model = AutoModelForCausalLM.from_pretrained(
+    MODEL_NAME, torch_dtype=torch.float16, device_map="auto"
+)
 # ZeroGPU için model GPU'ya sadece gerektiğinde yüklenecek
 @spaces.GPU
 def generate(prompt):
     inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     output = model.generate(**inputs, max_length=500)
     response = tokenizer.decode(output[0], skip_special_tokens=True)