Spaces:

Hodely
/

Amside-Ai

Sleeping

Hodely commited on Jun 11

Commit

aecb052

verified ·

1 Parent(s): e6b3aea

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,31 +4,36 @@ import torch
 import os
 from huggingface_hub import login
 hf_token = os.environ["HF_TOKEN"]
 login(token=hf_token)
 device = 0 if torch.cuda.is_available() else -1
 pipe = pipeline(
     "text-generation",
-    model="HuggingFaceH4/zephyr-1.3b",
     device=device
 )
 def responder(prompt):
-    formatted_prompt = f"<|system|>You are a helpful assistant.<|user|>{prompt}<|assistant|>"
     respuesta = pipe(
         formatted_prompt,
-        max_new_tokens=100,
         do_sample=True,
         temperature=0.7,
         top_k=50,
         top_p=0.9
-    )[0]['generated_text']
     return respuesta.replace(formatted_prompt, "").strip()
 with gr.Blocks() as demo:
-    gr.Markdown("## 🤖 AmInside 1.0 – versión ligera y educada")
     entrada = gr.Textbox(label="Escribe tu mensaje")
     salida = gr.Textbox(label="Respuesta")
     entrada.submit(fn=responder, inputs=entrada, outputs=salida)

 import os
 from huggingface_hub import login
+# Login con token seguro
 hf_token = os.environ["HF_TOKEN"]
 login(token=hf_token)
+# Usa GPU si hay
 device = 0 if torch.cuda.is_available() else -1
+# Modelo de tipo chat liviano
 pipe = pipeline(
     "text-generation",
+    model="mistralai/TinyMistral-248M-Chat-v1",
     device=device
 )
+# Formato chat para prompts
 def responder(prompt):
+    formatted_prompt = f"[INST] {prompt} [/INST]"
     respuesta = pipe(
         formatted_prompt,
+        max_new_tokens=80,
         do_sample=True,
         temperature=0.7,
         top_k=50,
         top_p=0.9
+    )[0]["generated_text"]
     return respuesta.replace(formatted_prompt, "").strip()
+# Interfaz Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("## ⚡ AmInside 1.0 – Versión Chat Ligera")
     entrada = gr.Textbox(label="Escribe tu mensaje")
     salida = gr.Textbox(label="Respuesta")
     entrada.submit(fn=responder, inputs=entrada, outputs=salida)