Spaces:

Wuttipong8146
/

AI

Sleeping

App Files Files Community

Wuttipong8146 commited on Aug 26, 2024

Commit

bc920c0

verified ·

1 Parent(s): 7bb130b

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -11

app.py CHANGED Viewed

@@ -1,14 +1,12 @@
 import streamlit as st
 import pdfplumber
-from langchain import PromptTemplate, LLMChain
-from langchain.chat_models import HuggingFaceHub
-from langchain.chains import ConversationalRetrievalChain
-from langchain.vectorstores import Chroma
-from langchain.document_loaders import TextLoader
-from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.memory import ConversationBufferMemory
-from transformers import AutoTokenizer, AutoModelForQuestionAnswering
 # โหลดโมเดล ThaiBERT จาก Hugging Face
 tokenizer = AutoTokenizer.from_pretrained("airesearch/wangchanberta-base-att-spm-uncased")
@@ -26,8 +24,8 @@ def extract_text_from_pdf(pdf_file):
 def answer_question(question, context):
     inputs = tokenizer.encode_plus(question, context, return_tensors="pt")
     answer_start_scores, answer_end_scores = model(**inputs)
-    answer_start = torch.argmax(answer_start_scores)
-    answer_end = torch.argmax(answer_end_scores) + 1
     answer = tokenizer.convert_tokens_to_string(tokenizer.convert_ids_to_tokens(inputs['input_ids'][0][answer_start:answer_end]))
     return answer
@@ -51,7 +49,7 @@ if uploaded_file:
     qa_chain = ConversationalRetrievalChain(
         retriever=retriever,
-        llm=HuggingFaceHub(repo_id="airesearch/wangchanberta-base-att-spm-uncased", model_kwargs={"temperature": 0}),
         memory=memory
     )
@@ -61,4 +59,3 @@ if uploaded_file:
     if user_question:
         response = qa_chain.run(user_question)
         st.write("Answer:", response)

 import streamlit as st
 import pdfplumber
+from transformers import AutoTokenizer, AutoModelForQuestionAnswering
+import torch
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.vectorstores import Chroma
+from langchain.chains import ConversationalRetrievalChain
 from langchain.memory import ConversationBufferMemory
 # โหลดโมเดล ThaiBERT จาก Hugging Face
 tokenizer = AutoTokenizer.from_pretrained("airesearch/wangchanberta-base-att-spm-uncased")
 def answer_question(question, context):
     inputs = tokenizer.encode_plus(question, context, return_tensors="pt")
     answer_start_scores, answer_end_scores = model(**inputs)
+    answer_start = torch.argmax(answer_start_scores.logits)
+    answer_end = torch.argmax(answer_end_scores.logits) + 1
     answer = tokenizer.convert_tokens_to_string(tokenizer.convert_ids_to_tokens(inputs['input_ids'][0][answer_start:answer_end]))
     return answer
     qa_chain = ConversationalRetrievalChain(
         retriever=retriever,
+        llm=None,  # ถ้าคุณไม่ได้ใช้ HuggingFaceHub, ปรับให้เหมาะสม
         memory=memory
     )
     if user_question:
         response = qa_chain.run(user_question)
         st.write("Answer:", response)