Spaces:

yusufs
/

vllm-inference

Paused

yusufs commited on Nov 27, 2024

Commit

b41be20

1 Parent(s): 35decf8

feat(response): should dict only

Files changed (1) hide show

main.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import random
 import torch
 from typing import Any
@@ -121,7 +122,7 @@ class GenerationResponse(BaseModel):
 @app.post("/generate-llama3-2")
-def generate_text(request: GenerationRequest) -> list[RequestOutput] | dict[str, str]:
     try:
         sampling_params: SamplingParams = SamplingParams(
             temperature=request.temperature,
@@ -130,11 +131,17 @@ def generate_text(request: GenerationRequest) -> list[RequestOutput] | dict[str,
         )
         # Generate text
-        return engine_llama_3_2.generate(
             prompts=request.prompt,
             sampling_params=sampling_params
         )
     except Exception as e:
         return {
             "error": str(e)

+import json
 import random
 import torch
 from typing import Any
 @app.post("/generate-llama3-2")
+def generate_text(request: GenerationRequest) -> dict[str, Any]:
     try:
         sampling_params: SamplingParams = SamplingParams(
             temperature=request.temperature,
         )
         # Generate text
+        response: list[RequestOutput] = engine_llama_3_2.generate(
             prompts=request.prompt,
             sampling_params=sampling_params
         )
+        output: str = json.dumps(obj=response)
+        return {
+            "output": json.loads(s=output),
+        }
     except Exception as e:
         return {
             "error": str(e)