0909_test / app.py
Carina1025's picture
Update app.py
2b42ef6 verified
raw
history blame
1.78 kB
import gradio as gr
def check_transcript(transcript, threshold=10):
"""
檢查逐字稿中的時間段是否有漏掉的部分。
Parameters:
- transcript: 逐字稿文本,格式為 "開始時間 - 結束時間\n文字內容"
- threshold: 判斷時間間隔的閾值,單位為秒(默認為 10 秒)
Returns:
- 輸出是否存在時間段遺漏的提示信息。
"""
# 將逐字稿文本分割成行
lines = transcript.split('\n')
# 初始化變量以儲存時間戳
end_times = []
for line in lines:
if " - " in line:
# 提取結束時間部分
time_str = line.split(" - ")[1].strip()
# 將時間戳轉換為秒數
h, m, s = map(float, time_str.split(":"))
total_seconds = h * 3600 + m * 60 + s
end_times.append(total_seconds)
# 檢查時間戳之間的間隔
gaps = []
for i in range(1, len(end_times)):
gap = end_times[i] - end_times[i-1]
if gap > threshold:
gaps.append(f"發現時間間隔過長: {gap:.2f} 秒,發生於第 {i} 段至第 {i+1} 段之間。")
if not gaps:
return "逐字稿無漏掉部分。"
else:
return "\n".join(gaps)
# 建立 Gradio 界面
iface = gr.Interface(
fn=check_transcript,
inputs=[
gr.Textbox(lines=10, label="逐字稿文本"),
gr.Number(default=10, label="時間間隔閾值(秒數)")
],
outputs="text",
title="逐字稿漏掉檢查工具",
description="輸入逐字稿文本,檢查時間週是否有漏掉的部分。格式為 '開始時間 - 結束時間\n文字內容',例如 '00:00:01 - 00:00:03\n書局舉辦週年慶'"
)
# 啟動 Gradio 應用
iface.launch()