ImportFattureAI

Sleeping

App Files Files Community

MatteoScript commited on Mar 12

Commit

a7435d7

verified ·

1 Parent(s): 533869e

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -12

app.py CHANGED Viewed

@@ -31,7 +31,7 @@ if st.session_state.logged == False:
     with login_placeholder.container():
         container = st.container(border=True)
         username = container.text_input('Username')
-        password = container.text_input('Passowrd')
         login = container.button('  Login  ', type='primary')
     if not login or username != os.getenv("LOGIN_USER") or  password != os.getenv("LOGIN_PASSWORD"):
         if login:
@@ -46,21 +46,21 @@ with st.expander("Guida completa"):
 ## Funzionalità Principali
 - **Caricamento e Gestione dei Documenti**
-- Supporta il caricamento di file PDF, JPG, JPEG e PNG tramite un’interfaccia Streamlit.
-- Se il file è un PDF con più pagine, viene suddiviso in sezioni (configurabile tramite uno slider) per una gestione più efficace. Più il numero è basso più il risultato è preciso.
 - **Conversione dei Dati**
-- **Upload e Inoltro a Gemini**: I file vengono caricati e inviati al rispettivo servizio AI.
-- **Estrazione dei Dati**: Il sistema invia il documento a un modello di generazione AI per ottenere una rappresentazione JSON contenente i dati (ad es. numero di documento, data, totale imponibile e articoli).
 - **Validazione e Verifica**
-- **Validazione JSON**: Utilizza Pydantic per verificare la correttezza della struttura e dei dati estratti. In caso di errori, il documento viene riprocessato fino a 3 volte per cercare di correggere le anomalie.
-- **Verifica Incrociata dei Contenuti**: Per i PDF, viene estratto il testo con PyPDF2 e confrontato con i codici articolo per assicurarsi che i dati siano effettivamente presenti nel documento.
-- **Filtraggio Articoli**: Vengono mantenuti solo gli articoli compatibili con i criteri specifici (codici articolo e importi non nulli).
 - **Visualizzazione e Highlighting**
-- I dati validati vengono mostrati in formato tabellare e in JSON.
-- Se il documento è un PDF, il sistema evidenzia graficamente (con rettangoli rossi) i testi relativi agli articoli compatibili, semplificando il controllo visivo.
 ## Avvertenze per l'Operatore
@@ -114,7 +114,7 @@ def wait_for_files_active(files):
     print("\n...all files ready")
 # Chiamata API Gemini
-def send_message_to_gemini(chat_session, message, max_attempts=3):
     """Tenta di inviare il messaggio tramite la chat_session, riprovando fino a max_attempts in caso di eccezioni, con un delay di 10 secondi tra i tentativi. """
     for attempt in range(max_attempts):
         try:
@@ -233,7 +233,14 @@ def process_document_splitted(file_path: str, chunk_label: str, use_azure: bool
         files = [upload_to_gemini(file_path, mime_type=mime_type)]
         wait_for_files_active(files)
         chat_history = [{ "role": "user","parts": [files[0]]}]
-        chat_session = model.start_chat(history=chat_history)
     max_validation_attempts = 3
     max_number_reprocess = 3
     chunk_document = None

     with login_placeholder.container():
         container = st.container(border=True)
         username = container.text_input('Username')
+        password = container.text_input('Passowrd', type='password')
         login = container.button('  Login  ', type='primary')
     if not login or username != os.getenv("LOGIN_USER") or  password != os.getenv("LOGIN_PASSWORD"):
         if login:
 ## Funzionalità Principali
 - **Caricamento e Gestione dei Documenti**
+    - Supporta il caricamento di file PDF, JPG, JPEG e PNG tramite un’interfaccia Streamlit.
+    - Se il file è un PDF con più pagine, viene suddiviso in sezioni (configurabile tramite uno slider) per una gestione più efficace. Più il numero è basso più il risultato è preciso.
 - **Conversione dei Dati**
+    - **Upload e Inoltro a Gemini**: I file vengono caricati e inviati al rispettivo servizio AI.
+    - **Estrazione dei Dati**: Il sistema invia il documento a un modello di generazione AI per ottenere una rappresentazione JSON contenente i dati (ad es. numero di documento, data, totale imponibile e articoli).
 - **Validazione e Verifica**
+    - **Validazione JSON**: Utilizza Pydantic per verificare la correttezza della struttura e dei dati estratti. In caso di errori, il documento viene riprocessato fino a 3 volte per cercare di correggere le anomalie.
+    - **Verifica Incrociata dei Contenuti**: Per i PDF, viene estratto il testo con PyPDF2 e confrontato con i codici articolo per assicurarsi che i dati siano effettivamente presenti nel documento.
+    - **Filtraggio Articoli**: Vengono mantenuti solo gli articoli compatibili con i criteri specifici (codici articolo e importi non nulli).
 - **Visualizzazione e Highlighting**
+    - I dati validati vengono mostrati in formato tabellare e in JSON.
+    - Se il documento è un PDF, il sistema evidenzia graficamente (con rettangoli rossi) i testi relativi agli articoli compatibili, semplificando il controllo visivo.
 ## Avvertenze per l'Operatore
     print("\n...all files ready")
 # Chiamata API Gemini
+def send_message_to_gemini(chat_session, message, max_attempts=5):
     """Tenta di inviare il messaggio tramite la chat_session, riprovando fino a max_attempts in caso di eccezioni, con un delay di 10 secondi tra i tentativi. """
     for attempt in range(max_attempts):
         try:
         files = [upload_to_gemini(file_path, mime_type=mime_type)]
         wait_for_files_active(files)
         chat_history = [{ "role": "user","parts": [files[0]]}]
+        for attempt in range(3):
+            try:
+                chat_session = model.start_chat(history=chat_history)
+                break
+            except Exception as e:
+                print(f"Errore nello Start chat")
+                time.sleep(10)
     max_validation_attempts = 3
     max_number_reprocess = 3
     chunk_document = None