espnet
/

fastspeech2_conformer

fastspeech2_conformer

Inference Endpoints

Model card Files Files and versions Community

connor-henderson commited on Sep 18, 2023

Commit

ef328ad

·

1 Parent(s): ba406a3

Upload model

Files changed (2) hide show

config.json +23 -17
pytorch_model.bin +2 -2

config.json CHANGED Viewed

@@ -2,28 +2,34 @@
   "architectures": [
     "FastSpeech2ConformerModel"
   ],
-  "decoder_attention_dropout_rate": 0.2,
-  "decoder_concat_after": false,
-  "decoder_dropout_rate": 0.2,
-  "decoder_kernel_size": 31,
-  "decoder_layers": 4,
-  "decoder_linear_units": 1536,
-  "decoder_normalize_before": false,
-  "decoder_num_attention_heads": 2,
-  "decoder_positional_dropout_rate": 0.2,
   "duration_predictor_channels": 256,
   "duration_predictor_dropout_rate": 0.2,
   "duration_predictor_kernel_size": 3,
   "duration_predictor_layers": 2,
-  "encoder_attention_dropout_rate": 0.2,
-  "encoder_concat_after": false,
-  "encoder_dropout_rate": 0.2,
-  "encoder_kernel_size": 7,
   "encoder_layers": 4,
-  "encoder_linear_units": 1536,
-  "encoder_normalize_before": false,
   "encoder_num_attention_heads": 2,
-  "encoder_positional_dropout_rate": 0.2,
   "energy_embed_dropout": 0.0,
   "energy_embed_kernel_size": 1,
   "energy_predictor_channels": 256,
@@ -55,7 +61,7 @@
   "stop_gradient_from_energy_predictor": false,
   "stop_gradient_from_pitch_predictor": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.32.0.dev0",
   "use_cnn_in_conformer": true,
   "use_macaron_style_in_conformer": true,
   "use_masking": true,

   "architectures": [
     "FastSpeech2ConformerModel"
   ],
+  "decoder_config": {
+    "attention_dropout_rate": 0.2,
+    "concat_after": false,
+    "dropout_rate": 0.2,
+    "kernel_size": 31,
+    "layers": 4,
+    "linear_units": 1536,
+    "normalize_before": false,
+    "num_attention_heads": 2,
+    "positional_dropout_rate": 0.2
+  },
   "duration_predictor_channels": 256,
   "duration_predictor_dropout_rate": 0.2,
   "duration_predictor_kernel_size": 3,
   "duration_predictor_layers": 2,
+  "encoder_config": {
+    "attention_dropout_rate": 0.2,
+    "concat_after": false,
+    "dropout_rate": 0.2,
+    "kernel_size": 7,
+    "layers": 4,
+    "linear_units": 1536,
+    "normalize_before": false,
+    "num_attention_heads": 2,
+    "positional_dropout_rate": 0.2
+  },
   "encoder_layers": 4,
   "encoder_num_attention_heads": 2,
   "energy_embed_dropout": 0.0,
   "energy_embed_kernel_size": 1,
   "energy_predictor_channels": 256,
   "stop_gradient_from_energy_predictor": false,
   "stop_gradient_from_pitch_predictor": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.33.0.dev0",
   "use_cnn_in_conformer": true,
   "use_macaron_style_in_conformer": true,
   "use_masking": true,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b800687a1dd023a09e2b74a95670c207188aa8029423e333060719572e6bf6f0
-size 281215433

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa4096f1c4ce019198a7ec8054a7828916bc94b6c6cb968d7723d5a4b808b7a8
+size 281215241