Spaces:

nsfwalex
/

whisper-transcribe-new

Running on Zero

liuyang commited on 19 days ago

Commit

5dddf57

1 Parent(s): 4417549

Add job_id and task_id handling in WhisperTranscriber to improve metadata management during audio processing. Update file key generation for intermediate uploads.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -279,6 +279,7 @@ def prepare_and_save_audio_for_model(task: dict, out_dir: str) -> dict:
         "abs_start_ms": int(ck["global_offset_ms"]) + eff_start_ms,
         "chunk_idx": idx,
         "channel": ch,
         "skip": False if (trim_applied or len(pcm) > 0) else True,
     }
@@ -724,8 +725,8 @@ class WhisperTranscriber:
                 "batch_size": batch_size,
                 "speaker_embeddings": speaker_embeddings,
             }
-            job_id = task_json["job_id"]
-            task_id = task_json["task_id"]["chunk"]["idx"]
             filekey = f"ai-transcribe/split/{job_id}-{task_id}.json"
             ret = upload_to_r2(json.dumps(result), "intermediate", filekey)
             if ret:

         "abs_start_ms": int(ck["global_offset_ms"]) + eff_start_ms,
         "chunk_idx": idx,
         "channel": ch,
+        "job_id": job,
         "skip": False if (trim_applied or len(pcm) > 0) else True,
     }
                 "batch_size": batch_size,
                 "speaker_embeddings": speaker_embeddings,
             }
+            job_id = pre_meta["job_id"]
+            task_id = pre_meta["chunk_idx"]
             filekey = f"ai-transcribe/split/{job_id}-{task_id}.json"
             ret = upload_to_r2(json.dumps(result), "intermediate", filekey)
             if ret: