Update utils.py
Browse files
utils.py
CHANGED
|
@@ -155,6 +155,7 @@ EMBEDDING_MODELL = "sentence-transformers/all-mpnet-base-v2"
|
|
| 155 |
HF_MODELL ="EleutherAI/gpt-neo-2.7B"
|
| 156 |
modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
|
| 157 |
tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
|
|
|
|
| 158 |
|
| 159 |
"""
|
| 160 |
HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
|
|
@@ -391,7 +392,7 @@ def llm_chain2(prompt, context):
|
|
| 391 |
attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
|
| 392 |
#Generiere die Antwort
|
| 393 |
outputs = modell_rag.generate(
|
| 394 |
-
inputs,
|
| 395 |
attention_mask=attention_mask,
|
| 396 |
max_new_tokens=1024,
|
| 397 |
do_sample=True,
|
|
@@ -589,6 +590,22 @@ def list_pdfs():
|
|
| 589 |
return []
|
| 590 |
return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
|
| 591 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 592 |
|
| 593 |
#################################################
|
| 594 |
#Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...
|
|
|
|
| 155 |
HF_MODELL ="EleutherAI/gpt-neo-2.7B"
|
| 156 |
modell_rag = GPTNeoForCausalLM.from_pretrained(HF_MODELL)
|
| 157 |
tokenizer_rag = GPT2Tokenizer.from_pretrained(HF_MODELL)
|
| 158 |
+
tokenizer_rag.pad_token = tokenizer_rag.eos_token
|
| 159 |
|
| 160 |
"""
|
| 161 |
HF_MODELL = "microsoft/Phi-3-mini-4k-instruct"
|
|
|
|
| 392 |
attention_mask = (inputs != tokenizer_rag.pad_token_id).long()
|
| 393 |
#Generiere die Antwort
|
| 394 |
outputs = modell_rag.generate(
|
| 395 |
+
inputs.input_ids,
|
| 396 |
attention_mask=attention_mask,
|
| 397 |
max_new_tokens=1024,
|
| 398 |
do_sample=True,
|
|
|
|
| 590 |
return []
|
| 591 |
return [f for f in os.listdir(SAVE_DIR) if f.endswith('.pdf')]
|
| 592 |
|
| 593 |
+
##########################################
|
| 594 |
+
#Extension des hochgeladenen Files bestimmen
|
| 595 |
+
def analyze_file(file):
|
| 596 |
+
file_extension = file.name.split('.')[-1] # Holen Sie sich die Dateiendung
|
| 597 |
+
return file_extension
|
| 598 |
+
|
| 599 |
+
########################################
|
| 600 |
+
#Aus dem File-Pfad nur den Namen herausholen
|
| 601 |
+
def get_filename(file_pfad):
|
| 602 |
+
parts = file_pfad.rsplit('/', 1) # Den String nach dem letzten '/' aufteilen
|
| 603 |
+
if len(parts) == 2:
|
| 604 |
+
result = parts[1] # Der Teil nach dem letzten '/' ist in parts[1]
|
| 605 |
+
else:
|
| 606 |
+
result = "Ein Fehler im Filenamen ist aufgetreten..."
|
| 607 |
+
return result
|
| 608 |
+
|
| 609 |
|
| 610 |
#################################################
|
| 611 |
#Klasse mit zuständen - z.B. für interrupt wenn Stop gedrückt...
|