atsushieee commited on
Commit
770369d
·
1 Parent(s): 414f5e3

Update main.py

Browse files
Files changed (1) hide show
  1. main.py +2 -109
main.py CHANGED
@@ -28,115 +28,8 @@ data = {
28
 
29
  df = pd.DataFrame(data)
30
 
31
- def create_plot():
32
- fig = px.scatter(df, x='x', y='y', text='id',
33
- title='Interactive Numeric Scatter Plot')
34
-
35
- # マーカーのスタイルを設定(紫系の色に設定)
36
- fig.update_traces(
37
- marker=dict(
38
- size=10,
39
- color='#663399', # 紫色
40
- line=dict(color='#4B0082', width=1) # より暗い紫の境界線
41
- ),
42
- textposition='top center'
43
- )
44
-
45
- # レイアウトの設定
46
- fig.update_layout(
47
- height=600,
48
- width=800,
49
- clickmode='event+select',
50
- plot_bgcolor='white',
51
- paper_bgcolor='white',
52
- xaxis=dict(
53
- showgrid=False,
54
- zeroline=False,
55
- range=[-35, 35] # x軸の範囲を設定
56
- ),
57
- yaxis=dict(
58
- showgrid=False,
59
- zeroline=False,
60
- range=[-30, 30] # y軸の範囲を設定
61
- )
62
- )
63
-
64
- return fig
65
-
66
- def run_main(audio_file,shift, speaker_id):
67
- # 固定の引数を設定
68
- class Args:
69
- pass
70
-
71
- args = Args()
72
- args.config = "configs/base.yaml"
73
- args.model = "./vits_pretrain/sovits5.0.pretrain.pth"
74
- speaker_str = f"{speaker_id:04d}"
75
- args.spk = f"./configs/singers/singer{speaker_str}.npy"
76
- args.wave = audio_file
77
- args.shift = shift
78
-
79
- # オプショナルパラメータのデフォルト値設定
80
- args.ppg = None
81
- args.vec = None
82
- args.pit = None
83
- args.enable_retrieval = False
84
- args.retrieval_index_prefix = ""
85
- args.retrieval_ratio = 0.5
86
- args.n_retrieval_vectors = 3
87
- args.hubert_index_path = None
88
- args.whisper_index_path = None
89
- args.debug = False
90
-
91
- try:
92
- main(args)
93
- return "svc_out.wav" # 音声ファイルのパスを返す
94
- except Exception as e:
95
- return None
96
-
97
- # Gradio インターフェースの作成
98
- with gr.Blocks() as demo:
99
- gr.Markdown("# SVC 音声変換システム")
100
-
101
- # 入力音声のアップロード
102
  input_audio = gr.Audio(
103
  label="変換したい音声をアップロード",
104
  type="filepath" # ファイルパスとして取得
105
- )
106
-
107
- with gr.Row():
108
- plot = gr.Plot(value=create_plot())
109
- # Speaker ID の選択
110
- speaker_id = gr.Number(
111
- label="Speaker ID (1-56)",
112
- value=1,
113
- minimum=1,
114
- maximum=56,
115
- step=1
116
- )
117
-
118
- # Pitch シフトのスライダー
119
- shift = gr.Slider(
120
- minimum=-12,
121
- maximum=12,
122
- value=0,
123
- step=1,
124
- label="Pitch Shift(-12から+12の半音)"
125
- )
126
-
127
- # ボタン
128
- run_btn = gr.Button(value="音声変換を実行", variant="primary", size="lg")
129
-
130
- # 出力表示用
131
- output_audio = gr.Audio(label="変換後の音声")
132
-
133
-
134
- run_btn.click(
135
- fn=run_main,
136
- inputs=[input_audio, shift, speaker_id],
137
- outputs=[output_audio]
138
- )
139
-
140
- # アプリケーションの起動
141
- if __name__ == "__main__":
142
- demo.launch()
 
28
 
29
  df = pd.DataFrame(data)
30
 
31
+ # 入力音声のアップロード
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
32
  input_audio = gr.Audio(
33
  label="変換したい音声をアップロード",
34
  type="filepath" # ファイルパスとして取得
35
+ )