Spaces:

RWKV-Red-Team
/

RWKV-LatestSpace

Running on T4

sparkleman commited on Apr 24

Commit

efc2316

1 Parent(s): 2dd12cc

UPDATE: [0] prefill

Files changed (1) hide show

app.py CHANGED Viewed

@@ -333,7 +333,7 @@ async def chatResponse(
     )
     logger.info(f"[REQ] {completionId} - prompt - {prompt}")
-    out, model_tokens, model_state = await runPrefill(request, prompt, [], model_state)
     prefillTime = time.time()
     promptTokenCount = len(model_tokens)
@@ -415,9 +415,9 @@ async def chatResponseStream(
         else request.prompt.strip()
     )
-    logger.info(f"[REQ] {completionId} - context - {prompt}")
-    out, model_tokens, model_state = await runPrefill(request, prompt, [], model_state)
     prefillTime = time.time()
     promptTokenCount = len(model_tokens)

     )
     logger.info(f"[REQ] {completionId} - prompt - {prompt}")
+    out, model_tokens, model_state = await runPrefill(request, prompt, [0], model_state)
     prefillTime = time.time()
     promptTokenCount = len(model_tokens)
         else request.prompt.strip()
     )
+    logger.info(f"[REQ] {completionId} - context\n```{prompt}```")
+    out, model_tokens, model_state = await runPrefill(request, prompt, [0], model_state)
     prefillTime = time.time()
     promptTokenCount = len(model_tokens)