Spaces:

EnzGamers
/

smallagent

Sleeping

App Files Files Community

EnzGamers commited on Aug 2

Commit

32a81bd

verified ·

1 Parent(s): fb7cb35

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -6

app.py CHANGED Viewed

@@ -45,12 +45,12 @@ class ChatCompletionResponse(BaseModel):
     choices: list[ChatCompletionResponseChoice]
 # --- Définition de l'API compatible OpenAI ---
-@app.post("/v1/chat/completions")
 async def create_chat_completion(request: ChatCompletionRequest):
     """
     Endpoint compatible avec l'API OpenAI Chat Completions.
     """
-    # Extraire le dernier message utilisateur pour le prompt
     user_prompt = ""
     if request.messages and request.messages[-1].role == "user":
         user_prompt = request.messages[-1].content
@@ -58,17 +58,13 @@ async def create_chat_completion(request: ChatCompletionRequest):
     if not user_prompt:
         return {"error": "No user prompt found"}
-    # Préparation des inputs pour le modèle DeepSeek
     messages_for_model = [{'role': 'user', 'content': user_prompt}]
     inputs = tokenizer.apply_chat_template(messages_for_model, add_generation_prompt=True, return_tensors="pt").to(DEVICE)
-    # Génération
     outputs = model.generate(inputs, max_new_tokens=request.max_tokens, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id)
-    # Décodage
     response_text = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
-    # Formatage de la réponse au format OpenAI
     response_message = ChatMessage(role="assistant", content=response_text)
     choice = ChatCompletionResponseChoice(message=response_message)
     completion_response = ChatCompletionResponse(

     choices: list[ChatCompletionResponseChoice]
 # --- Définition de l'API compatible OpenAI ---
+# LA SEULE LIGNE QUI CHANGE EST CELLE-CI : on a enlevé le "/v1"
+@app.post("/chat/completions")
 async def create_chat_completion(request: ChatCompletionRequest):
     """
     Endpoint compatible avec l'API OpenAI Chat Completions.
     """
     user_prompt = ""
     if request.messages and request.messages[-1].role == "user":
         user_prompt = request.messages[-1].content
     if not user_prompt:
         return {"error": "No user prompt found"}
     messages_for_model = [{'role': 'user', 'content': user_prompt}]
     inputs = tokenizer.apply_chat_template(messages_for_model, add_generation_prompt=True, return_tensors="pt").to(DEVICE)
     outputs = model.generate(inputs, max_new_tokens=request.max_tokens, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id)
     response_text = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
     response_message = ChatMessage(role="assistant", content=response_text)
     choice = ChatCompletionResponseChoice(message=response_message)
     completion_response = ChatCompletionResponse(