Spaces:

the-confused-coder
/

talk_to_YouTube

Sleeping

App Files Files Community

talk_to_YouTube / app.py

the-confused-coder

Update app.py

58bb07d verified 10 months ago

raw

history blame contribute delete

4.48 kB

	# other imports
	import streamlit as st, os
	import spaces
	import tempfile
	from pytube import YouTube
	import whisper
	from dotenv import load_dotenv

	# langchain imports
	from langchain_community.vectorstores import FAISS
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain_openai import OpenAIEmbeddings
	from langchain_openai import OpenAI
	from langchain_core.prompts import ChatPromptTemplate
	from langchain_core.output_parsers import StrOutputParser
	from langchain_core.runnables import RunnablePassthrough


	# initialize session state variables if not already initialized
	if 'chain' not in st.session_state:
	st.session_state.chain = None
	if 'transcription' not in st.session_state:
	st.session_state.transcription = None
	if 'thumbnail_url' not in st.session_state:
	st.session_state.thumbnail_url = None



	# function for getting transcribing YouTube video
	def get_yt_trans(yt_obj):
	video_audio = yt_obj.streams.filter(only_audio=True).first()
	# define model for audio to text conversion
	audio_to_text_model = whisper.load_model('base')
	# store transcription in local file
	with tempfile.TemporaryDirectory() as tmpdir:
	audio_file = video_audio.download(output_path=tmpdir)
	st.session_state.transcription = audio_to_text_model.transcribe(audio_file, fp16=False)["text"].strip()
	# with open("transcription.txt", "w") as file:
	# file.write(transcription)



	# function for chunking transcription text
	def get_vid_text_chunks(transcription_text):
	text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=20)
	chunked_text = text_splitter.split_text(transcription_text)
	return chunked_text


	# function for creating vector db
	def create_vecdb(chunks):
	vecdb = FAISS.from_texts(chunks, OpenAIEmbeddings())
	# vecdb.save_local('vec_store') ## if needed to store and retrieve locally
	return vecdb


	# define api keys
	load_dotenv()
	os.environ['OPEN_API_KEY'] = os.getenv('OPENAI_API_KEY')

	# define LLM
	llm = OpenAI(temperature=0)

	# Set page configs
	st.set_page_config(
	page_title="YouTube Talks",
	page_icon='📽️'
	)
	st.header('Query YouTube Videos!')
	thumbnail_placeholder = st.empty()
	st.sidebar.header("URL details:")
	video_url = st.sidebar.text_input("Enter video URL")
	submit_button = st.sidebar.button("Submit")
	user_query = st.text_input("Query the Video!")
	video_query_button = st.button("Ask video!")
	progress_updates = st.sidebar.empty()
	main_ph = st.empty()

	# on button press
	if submit_button:
	main_ph.text("Transcribing Video, please wait...")
	progress_updates.text("Transcribing Video...")
	# get video transcription
	yt_obj = YouTube(video_url)
	# display video thumbnail
	st.session_state.thumbnail_url = yt_obj.thumbnail_url
	thumbnail_placeholder.image(st.session_state.thumbnail_url)
	# get transcription
	get_yt_trans(yt_obj)
	st.sidebar.subheader("Transcription:")
	st.sidebar.write(st.session_state.transcription)
	progress_updates.text("Making Text Chunks...")
	# get text chunks
	chunks = get_vid_text_chunks(st.session_state.transcription)
	progress_updates.text("Creating Vector DB...")
	# create vector db
	vector_db = create_vecdb(chunks)
	# define main prompt
	p_template = '''Answer the question based on the context below. If you can't
	answer the question, reply "I don't know".

	Context: {context}

	Question: {question}'''

	prompt = ChatPromptTemplate.from_template(p_template)
	# define output parser
	parser = StrOutputParser()
	# define main chain
	st.session_state.chain = {"context": vector_db.as_retriever(), "question": RunnablePassthrough()} \| prompt \| llm \| parser
	progress_updates.text("Video Transcribed Successfully!!!")
	main_ph.text("Video Transcribed Successfully!")


	if video_query_button:
	# keep displaying Transcription and Thumbnail in window
	st.sidebar.subheader("Transcription:")
	st.sidebar.write(st.session_state.transcription)
	thumbnail_placeholder.image(st.session_state.thumbnail_url)
	# if video not transcribed display error
	if st.session_state.chain is None:
	st.error("Please transcribe a video first by submitting a URL.")
	else:
	main_ph.text("Fetching Results...")
	# print results
	st.subheader("Result:")
	main_ph.text("Displaying Results...")
	st.write(st.session_state.chain.invoke(user_query))