Spaces:

MisterAI
/

Docker_Ollama

Running

MisterAI commited on 2 days ago

Commit

64e2dfd

verified ·

1 Parent(s): eed79e0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -97,12 +97,18 @@ def gradio_interface(model_name, input, max_tokens, temperature, history):
     global stop_flag
     stop_flag = False
     def worker():
         llm = check_and_load_model(model_name)
         for token in llm.stream(input, max_tokens=max_tokens, temperature=temperature):
             if stop_flag:
                 break
-            history.append((input, token))
             yield history, history
     # Utiliser un thread pour gérer le streaming
@@ -133,7 +139,6 @@ demo = gr.Interface(
     Cette Démo permet aux utilisateurs de tester tous les modèles Ollama dont la taille est inférieure à 10 milliards de paramètres directement depuis cette interface.
     L'Application tourne sur une machine Hugging Face Free Space : 2 CPU - 16Gb RAM
     Soyez patient...
     """
 )

     global stop_flag
     stop_flag = False
+    # Ajouter la requête de l'utilisateur à l'historique une seule fois
+    history.append((input, ""))
+    yield history, history
     def worker():
         llm = check_and_load_model(model_name)
+        response = ""
         for token in llm.stream(input, max_tokens=max_tokens, temperature=temperature):
             if stop_flag:
                 break
+            response += token
+            history[-1] = (input, response)
             yield history, history
     # Utiliser un thread pour gérer le streaming
     Cette Démo permet aux utilisateurs de tester tous les modèles Ollama dont la taille est inférieure à 10 milliards de paramètres directement depuis cette interface.
     L'Application tourne sur une machine Hugging Face Free Space : 2 CPU - 16Gb RAM
     Soyez patient...
     """
 )