Dupaja
/

speecht5_tts

Inference Endpoints

Model card Files Files and versions Community

Dupaja commited on Jan 2, 2024

Commit

3b62ecd

·

1 Parent(s): 4fd4826

Update handler.py

Files changed (1) hide show

handler.py +7 -7

handler.py CHANGED Viewed

@@ -3,7 +3,7 @@ import numpy as np
 import torch
 from transformers import SpeechT5Processor, SpeechT5ForTextToSpeech, SpeechT5HifiGan
 from datasets import load_dataset
-#import soundfile as sf
 from typing import Dict, List, Any
@@ -34,22 +34,22 @@ class EndpointHandler:
     def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
         given_text = data.get("inputs", "")
         inputs = self.processor(text=given_text, return_tensors="pt")
         speech = self.model.generate_speech(inputs["input_ids"], self.speaker_embeddings, vocoder=self.vocoder)
-        #filename = "current_sample.wav"
-        # Write the response audio to a file
-        #sf.write(filename, speech.numpy(), samplerate=16000)
         # Return the expected response format
         return {
             "statusCode": 200,
             "body": {
                 "audio": speech.numpy(),  # Consider encoding this to a suitable format
-                "sampling_rate": 16000
             }
         }

 import torch
 from transformers import SpeechT5Processor, SpeechT5ForTextToSpeech, SpeechT5HifiGan
 from datasets import load_dataset
+import time
 from typing import Dict, List, Any
     def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
         given_text = data.get("inputs", "")
+        start_time = time.time()
         inputs = self.processor(text=given_text, return_tensors="pt")
         speech = self.model.generate_speech(inputs["input_ids"], self.speaker_embeddings, vocoder=self.vocoder)
+        run_time = time.time() - start_time
         # Return the expected response format
         return {
             "statusCode": 200,
             "body": {
                 "audio": speech.numpy(),  # Consider encoding this to a suitable format
+                "sampling_rate": 16000,
+                "time_to_generate": str(run_time)
             }
         }