Spaces:

CerebrumTech
/

Cere-Gemma2-9b

Running on Zero

App Files Files Community

oguzhandoganoglu commited on Feb 7

Commit

f26facc

verified ·

1 Parent(s): 6337b9d

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -22

app.py CHANGED Viewed

@@ -9,24 +9,25 @@ from llama_cpp_agent.chat_history.messages import Roles
 import gradio as gr
 from huggingface_hub import hf_hub_download
 hf_hub_download(
     repo_id="CerebrumTech/cere-gemma-2-9b-tr",
     filename="unsloth.Q4_K_M.gguf",
     local_dir="./models"
 )
-# 推論関数
 @spaces.GPU(duration=120)
 def respond(
     message,
     history: list[tuple[str, str]],
-    model,
     system_message,
     max_tokens,
     temperature,
     top_p,
     top_k,
-    repeat_penalty,
 ):
     chat_template = MessagesFormatterType.GEMMA_2
@@ -41,7 +42,7 @@ def respond(
     agent = LlamaCppAgent(
         provider,
-        system_prompt=f"{system_message}",
         predefined_messages_formatter_type=chat_template,
         debug_output=True
     )
@@ -51,19 +52,19 @@ def respond(
     settings.top_k = top_k
     settings.top_p = top_p
     settings.max_tokens = max_tokens
-    settings.repeat_penalty = repeat_penalty
     settings.stream = True
     messages = BasicChatHistory()
-    for msn in history:
         user = {
             'role': Roles.user,
-            'content': msn[0]
         }
         assistant = {
             'role': Roles.assistant,
-            'content': msn[1]
         }
         messages.add_message(user)
         messages.add_message(assistant)
@@ -81,32 +82,27 @@ def respond(
         outputs += output
         yield outputs
 def create_interface(model_name, description):
-    return gr.Interface(
-        fn=respond,
-        inputs=[
             gr.Textbox(value="You are a helpful assistant.", label="System message"),
             gr.Textbox(value=model_name, label="Model", interactive=False),
             gr.Slider(minimum=1, maximum=4096, value=2048, step=1, label="Max tokens"),
             gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
             gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p"),
             gr.Slider(minimum=0, maximum=100, value=40, step=1, label="Top-k"),
-            gr.Slider(minimum=0.0, maximum=2.0, value=1.1, step=0.1, label="Repetition penalty"),
         ],
-        outputs=gr.Chatbot(show_copy_button=True),
         title=model_name,
         description=description,
-        live=True
     )
-description = """<p align="center"cCerebrumTech/cere-gemma-2-9b-tr/p>"""
 interface = create_interface('unsloth.Q4_K_M.gguf', description)
-demo = gr.Blocks()
-with demo:
-    interface.render()
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
 from huggingface_hub import hf_hub_download
+# Modeli indirme
 hf_hub_download(
     repo_id="CerebrumTech/cere-gemma-2-9b-tr",
     filename="unsloth.Q4_K_M.gguf",
     local_dir="./models"
 )
+# Yanıt üretme fonksiyonu
 @spaces.GPU(duration=120)
 def respond(
     message,
     history: list[tuple[str, str]],
     system_message,
+    model,
     max_tokens,
     temperature,
     top_p,
     top_k,
+    repetition_penalty,
 ):
     chat_template = MessagesFormatterType.GEMMA_2
     agent = LlamaCppAgent(
         provider,
+        system_prompt=system_message,
         predefined_messages_formatter_type=chat_template,
         debug_output=True
     )
     settings.top_k = top_k
     settings.top_p = top_p
     settings.max_tokens = max_tokens
+    settings.repeat_penalty = repetition_penalty
     settings.stream = True
     messages = BasicChatHistory()
+    for user_msg, assistant_msg in history:
         user = {
             'role': Roles.user,
+            'content': user_msg
         }
         assistant = {
             'role': Roles.assistant,
+            'content': assistant_msg
         }
         messages.add_message(user)
         messages.add_message(assistant)
         outputs += output
         yield outputs
+# Arayüz oluşturma fonksiyonu
 def create_interface(model_name, description):
+    return gr.ChatInterface(
+        fn=respond,
+        additional_inputs=[
             gr.Textbox(value="You are a helpful assistant.", label="System message"),
             gr.Textbox(value=model_name, label="Model", interactive=False),
             gr.Slider(minimum=1, maximum=4096, value=2048, step=1, label="Max tokens"),
             gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
             gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p"),
             gr.Slider(minimum=0, maximum=100, value=40, step=1, label="Top-k"),
+            gr.Slider(minimum=0.0, maximum 2.0, value=1.1, step=0.1, label="Repetition penalty"),
         ],
         title=model_name,
         description=description,
     )
+# Açıklama ve arayüz oluşturma
+description = """<p align="center">CerebrumTech/cere-gemma-2-9b-tr</p>"""
 interface = create_interface('unsloth.Q4_K_M.gguf', description)
+# Gradio uygulamasını başlatma
 if __name__ == "__main__":
+    interface.launch()