Spaces:

miso1234456
/

tryagain

Runtime error

miso1234456 commited on Oct 25, 2024

Commit

c79d190

verified ·

1 Parent(s): 9b2f273

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,23 +1,15 @@
-import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM
-import torch
-# Load the model and tokenizer with trust_remote_code=True
-model_name = "Flmc/DISC-MedLLM"
-tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", trust_remote_code=True)
-# Function to generate responses
 def generate_response(input_text):
     if not input_text.strip():
         return "Please enter some text to generate a response."
-    inputs = tokenizer(input_text, return_tensors="pt")
-    if torch.cuda.is_available():
-        inputs = inputs.to("cuda")
-        model.to("cuda")
-    outputs = model.generate(**inputs, max_new_tokens=150)
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
 # Gradio interface

+\import gradio as gr
+from transformers import pipeline
+# Set up the pipeline
+pipe = pipeline("text-generation", model="Flmc/DISC-MedLLM", trust_remote_code=True)
+# Define the function for generating responses
 def generate_response(input_text):
     if not input_text.strip():
         return "Please enter some text to generate a response."
+    response = pipe(input_text, max_new_tokens=150, do_sample=True)[0]["generated_text"]
     return response
 # Gradio interface