Spaces:

albhu
/

legalgeek

Runtime error

App Files Files Community

albhu commited on Apr 25, 2024

Commit

b568946

verified ·

1 Parent(s): d60519f

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -47

app.py CHANGED Viewed

@@ -3,15 +3,19 @@ import pdfplumber
 import docx
 from transformers import AutoTokenizer, AutoModelForCausalLM
-st.title("Jai")
 # Előző beszélgetések tárolása session state-ben
 if "previous_conversations" not in st.session_state:
     st.session_state.previous_conversations = []
 # Tokenizáló modell és válaszgeneráló modell választása
-tokenizer_name = st.sidebar.selectbox("Tokenizáló Modell", ["bert-base-uncased", "bert-base-multilingual-cased"])
-generator_name = st.sidebar.selectbox("Válaszgeneráló Modell", ["bert-base-uncased", "bert-base-multilingual-cased"])
 tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
 model = AutoModelForCausalLM.from_pretrained(generator_name, trust_remote_code=True)
@@ -32,54 +36,45 @@ def generate_response(input_text, tokenizer, model):
 document_file = st.file_uploader("Húzd ide a dokumentumot vagy kattints a feltöltéshez", type=["pdf", "docx", "doc"])
 if document_file is not None:
-    # Válaszgenerálás
-    if st.button("Generálj Választ"):
-        document_text = ""
-        if document_file.type == "application/pdf":
-            with pdfplumber.open(document_file) as pdf:
-                for page in pdf.pages:
-                    document_text += page.extract_text()
-                    # Ha bekezdésekre bontjuk, hozzáadhatunk például egy sortörést a bekezdések közé:
-                    document_text += "\n\n"
-        elif document_file.type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
-            docx_file = docx.Document(document_file)
-            for paragraph in docx_file.paragraphs:
-                document_text += paragraph.text
-                # Hasonlóan, itt is adhatunk hozzá sortörést a bekezdések közé:
-                document_text += "\n\n"
-        elif document_file.type == "application/msword":
-            doc_file = docx.Document(document_file)
-            for paragraph in doc_file.paragraphs:
-                document_text += paragraph.text
-                document_text += "\n\n"
-        else:
-            st.error("A fájltípus nem támogatott. Kérlek válassz ki egy PDF, DOCX vagy DOC fájlt!")
-        # Előző beszélgetésekhez csatolható kontextus
-        context = st.text_area("Korábbi Beszélgetéshez Tartozó Kontextus", "")
-        # Kérdés mező hozzáadása
-        question = st.text_input("Kérdés a Dokumentumból", "")
-        # Ha van kérdés, azt is hozzáadjuk a bemenethez
-        if question:
-            input_text = f"{context} {document_text} {question}" if context else f"{document_text} {question}"
-        else:
-            input_text = f"{context} {document_text}" if context else document_text
-        # Model használata a válasz generálásához
         response = generate_response(input_text, tokenizer, model)
-        # Válasz megjelenítése
         st.subheader("Generált Válasz:")
         st.write(response)
         # Aktuális beszélgetés hozzáadása az előző beszélgetésekhez
         st.session_state.previous_conversations.append({"input_text": input_text, "response": response})
-# Előző beszélgetések megjelenítése
-st.sidebar.subheader("Előző Beszélgetések")
-for conv in st.session_state.previous_conversations:
-    st.sidebar.write(conv["input_text"])
-    st.sidebar.write(conv["response"])

 import docx
 from transformers import AutoTokenizer, AutoModelForCausalLM
+st.title("Jogi Dokumentumok AI Válaszgenerálás")
 # Előző beszélgetések tárolása session state-ben
 if "previous_conversations" not in st.session_state:
     st.session_state.previous_conversations = []
+# Korábbi beszélgetések törlése
+if st.checkbox("Korábbi Beszélgetések Törlése"):
+    st.session_state.previous_conversations = []
 # Tokenizáló modell és válaszgeneráló modell választása
+tokenizer_name = st.selectbox("Tokenizáló Modell", ["bert-base-uncased", "bert-base-multilingual-cased"])
+generator_name = st.selectbox("Válaszgeneráló Modell", ["bert-base-uncased", "bert-base-multilingual-cased"])
 tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
 model = AutoModelForCausalLM.from_pretrained(generator_name, trust_remote_code=True)
 document_file = st.file_uploader("Húzd ide a dokumentumot vagy kattints a feltöltéshez", type=["pdf", "docx", "doc"])
 if document_file is not None:
+    document_text = ""
+    if document_file.type == "application/pdf":
+        with pdfplumber.open(document_file) as pdf:
+            for page in pdf.pages:
+                document_text += page.extract_text()
+                # Ha bekezdésekre bontjuk, hozzáadhatunk például egy sortörést a bekezdések közé:
+                document_text += "\n\n"
+    elif document_file.type == "application/vnd.openxmlformats-officedocument.wordprocessingml.document":
+        docx_file = docx.Document(document_file)
+        for paragraph in docx_file.paragraphs:
+            document_text += paragraph.text
+            # Hasonlóan, itt is adhatunk hozzá sortörést a bekezdések közé:
+            document_text += "\n\n"
+    elif document_file.type == "application/msword":
+        doc_file = docx.Document(document_file)
+        for paragraph in doc_file.paragraphs:
+            document_text += paragraph.text
+            document_text += "\n\n"
+    else:
+        st.error("A fájltípus nem támogatott. Kérlek válassz ki egy PDF, DOCX vagy DOC fájlt!")
+    # Előző beszélgetésekhez csatolható kontextus
+    context = st.text_area("Korábbi Beszélgetéshez Tartozó Kontextus", "")
+    # Kérdés mező hozzáadása
+    question = st.text_input("Kérdés a Dokumentumból", "")
+    # Ha van kérdés, azt is hozzáadjuk a bemenethez
+    if question:
+        input_text = f"{context} {document_text} {question}" if context else f"{document_text} {question}"
+    else:
+        input_text = f"{context} {document_text}" if context else document_text
+    # Válasz generálása csak akkor, ha a felhasználó elküldi a promptot
+    if input_text.strip() != "":
         response = generate_response(input_text, tokenizer, model)
         st.subheader("Generált Válasz:")
         st.write(response)
         # Aktuális beszélgetés hozzáadása az előző beszélgetésekhez
         st.session_state.previous_conversations.append({"input_text": input_text, "response": response})