Spaces:

JunyiAcademy
/

vaitor2

Running

App Files Files Community

youngtsai commited on Jan 19, 2024

Commit

a11ae70

1 Parent(s): ae369e8

def get_screenshot_from_video(video_link, start_time):

Browse files

Files changed (1) hide show

app.py +20 -6

app.py CHANGED Viewed

@@ -50,10 +50,11 @@ def docx_to_text(file):
     return "\n".join([para.text for para in doc.paragraphs])
 def format_seconds_to_time(seconds):
-    """将秒数格式化为 分:秒 的形式"""
-    minutes = int(seconds // 60)
     seconds = int(seconds % 60)
-    return f"{minutes:02}:{seconds:02}"
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
@@ -64,12 +65,17 @@ def process_youtube_link(link):
     questions = generate_questions(transcript)
     df_summarise = generate_df_summarise(transcript)
-    formatted_transcript = ""
     for entry in transcript:
         start_time = format_seconds_to_time(entry['start'])
         end_time = format_seconds_to_time(entry['start'] + entry['duration'])
-        line = f"---- 時間： {start_time} ～ {end_time} ----\n{entry['text']}\n\n"
-        formatted_transcript += line
     # 确保返回与 UI 组件预期匹配的输出
     return questions[0] if len(questions) > 0 else "", \
@@ -78,6 +84,14 @@ def process_youtube_link(link):
             df_summarise, \
             formatted_transcript
 def process_web_link(link):
     # 抓取和解析网页内容
     response = requests.get(link)

     return "\n".join([para.text for para in doc.paragraphs])
 def format_seconds_to_time(seconds):
+    """将秒数格式化为 时:分:秒 的形式"""
+    hours = int(seconds // 3600)
+    minutes = int((seconds % 3600) // 60)
     seconds = int(seconds % 60)
+    return f"{hours:02}:{minutes:02}:{seconds:02}"
 def process_youtube_link(link):
     # 使用 YouTube API 获取逐字稿
     questions = generate_questions(transcript)
     df_summarise = generate_df_summarise(transcript)
+    formatted_transcript = []
     for entry in transcript:
         start_time = format_seconds_to_time(entry['start'])
         end_time = format_seconds_to_time(entry['start'] + entry['duration'])
+        line = {
+            "start_time": start_time,
+            "end_time": end_time,
+            "text": entry['text'],
+            "screenshot": get_screenshot_from_video(link, entry['start'])
+        }
+        formatted_transcript.append(line)
     # 确保返回与 UI 组件预期匹配的输出
     return questions[0] if len(questions) > 0 else "", \
             df_summarise, \
             formatted_transcript
+def get_screenshot_from_video(video_link, start_time):
+    # 实现从视频中提取帧的逻辑
+    # 由于这需要服务器端处理，你可能需要一种方法来下载视频，
+    # 并使用 ffmpeg 或类似工具提取特定时间点的帧
+    # 这里只是一个示意性的函数实现
+    screenshot_url = f"[逻辑以提取视频 {video_link} 在 {start_time} 秒时的截图]"
+    return screenshot_url
 def process_web_link(link):
     # 抓取和解析网页内容
     response = requests.get(link)