Spaces:

segments
/

count-by-class

Running

App Files Files Community

Tomatillo commited on 11 days ago

Commit

20723b1

verified ·

1 Parent(s): 682a939

Updated streamlit app - removed parallel function

Browse files

Files changed (1) hide show

src/streamlit_app.py +28 -19

src/streamlit_app.py CHANGED Viewed

@@ -21,7 +21,6 @@ Usage:
 import streamlit as st
 import io
 import csv
-import concurrent.futures
 from segments import SegmentsClient
 from datetime import datetime
 import sys
@@ -228,8 +227,6 @@ if api_key and dataset_identifier:
 if is_multisensor:
     sensor_select = st.selectbox("Choose sensor (optional)", options=['All sensors'] + sensor_names)
-# Concurrency control
-parallel_workers = st.slider("Parallel requests", min_value=1, max_value=32, value=8, help="Increase to speed up processing; lower if you hit API limits.")
 if run_button:
     st.session_state.csv_content = None
@@ -254,15 +251,17 @@ if run_button:
             target_set = set(target_classes)
             metrics = []
             # Update loader after dataset type check
             if status_ctx is not None:
-                status_ctx.update(label="Dataset type checked. Processing samples...", state="running")
             progress = st.progress(0)
-            total = len(samples_objects)
             done = 0
-            with concurrent.futures.ThreadPoolExecutor(max_workers=parallel_workers) as executor:
-                futures = [
-                    executor.submit(
-                        compute_metrics_for_sample,
                         sample,
                         api_key,
                         target_set,
@@ -270,21 +269,31 @@ if run_button:
                         is_multisensor,
                         sensor_select,
                     )
-                    for sample in samples_objects
-                ]
-                for future in concurrent.futures.as_completed(futures):
-                    rows = future.result()
                     if rows:
                         metrics.extend(rows)
-                    done += 1
-                    if total:
-                        progress.progress(min(done / total, 1.0))
             if not metrics:
                 st.session_state.error = "No metrics could be generated for the dataset."
             else:
                 st.session_state.csv_content = generate_csv(metrics, dataset_identifier, target_classes)
-            if status_ctx is not None:
-                status_ctx.update(label="CSV generated!", state="complete")
         except Exception as e:
             st.session_state.error = f"An error occurred: {e}"
             if status_ctx is not None:
@@ -301,4 +310,4 @@ if st.session_state.csv_content:
         data=st.session_state.csv_content,
         file_name=filename,
         mime="text/csv"
-    )

 import streamlit as st
 import io
 import csv
 from segments import SegmentsClient
 from datetime import datetime
 import sys
 if is_multisensor:
     sensor_select = st.selectbox("Choose sensor (optional)", options=['All sensors'] + sensor_names)
 if run_button:
     st.session_state.csv_content = None
             target_set = set(target_classes)
             metrics = []
             # Update loader after dataset type check
+            total = len(samples_objects)
             if status_ctx is not None:
+                status_ctx.update(label=f"Dataset type checked. Processing {total} samples...", state="running")
             progress = st.progress(0)
             done = 0
+            failed_samples = []
+            # Process samples sequentially instead of in parallel
+            for i, sample in enumerate(samples_objects):
+                try:
+                    rows = compute_metrics_for_sample(
                         sample,
                         api_key,
                         target_set,
                         is_multisensor,
                         sensor_select,
                     )
                     if rows:
                         metrics.extend(rows)
+                    else:
+                        failed_samples.append(f"Sample {sample.uuid}: No metrics generated")
+                except Exception as e:
+                    failed_samples.append(f"Sample {sample.uuid}: {str(e)}")
+                done += 1
+                if total:
+                    progress.progress(min(done / total, 1.0))
             if not metrics:
                 st.session_state.error = "No metrics could be generated for the dataset."
             else:
                 st.session_state.csv_content = generate_csv(metrics, dataset_identifier, target_classes)
+                success_msg = f"CSV generated! Processed {len(metrics)} samples"
+                if failed_samples:
+                    success_msg += f" ({len(failed_samples)} samples failed)"
+                if status_ctx is not None:
+                    status_ctx.update(label=success_msg, state="complete")
+            if failed_samples:
+                st.warning(f"{len(failed_samples)} samples failed processing. First few errors:")
+                for failure in failed_samples[:5]:  # Show first 5 failures
+                    st.text(failure)
         except Exception as e:
             st.session_state.error = f"An error occurred: {e}"
             if status_ctx is not None:
         data=st.session_state.csv_content,
         file_name=filename,
         mime="text/csv"
+    )