Spaces:

gestiodinamica
/

continental_edusights

Running

jcmachicao commited on Jun 24, 2024

Commit

3f8da09

verified ·

1 Parent(s): 35947dd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# Actualizado por: José Carlos Machicao, Fecha de actualización: 2024_06_20
 import streamlit as st
 import pandas as pd
@@ -25,12 +25,12 @@ if uploaded_file is not None:
     df_050.index = df_050.DNI
     st.write(df_050.shape)
     # Depuración de columnas sólo para aquellas que contribuyen al clustering
     col_selec = []
     for col in df_050.columns:
         u_col = df_050[col].unique()
-        if len(u_col) < 25:
             col_selec.append(col)
     st.header('Lista de variables que será usada para la clusterización')
@@ -159,8 +159,11 @@ if uploaded_file is not None:
         ]
         enfoqueX['HexDens'] = 'Hex_'+str(c)
         enfoques = pd.concat([enfoques, enfoqueX])
-    csv = enfoques.to_csv(encoding='iso-8859-1')
     st.download_button(
         label="Descargar CSV",
@@ -169,7 +172,7 @@ if uploaded_file is not None:
         mime='text/csv'
     )
-    df = enfoques
     cat_col = df.select_dtypes(include=['object']).columns.tolist()
     df_dummies = pd.get_dummies(df[cat_col])
     percentage_presence = df_dummies.mean()*100
@@ -180,6 +183,7 @@ if uploaded_file is not None:
     df2['a'] = result
     df2['b'] = result.index
     df2 = df2.sort_values(by='a', ascending=False)
     df3 = df2.head(20)
     fig3 = px.line_polar(df3, r='a', theta='b')
     st.plotly_chart(fig3)
@@ -192,4 +196,3 @@ if uploaded_file is not None:
         file_name='frecuencias_experimento.csv',
         mime='text/csv'
     )

+# Actualizado por: José Carlos Machicao, Fecha de actualización: 2024_06_24, Taller Lima
 import streamlit as st
 import pandas as pd
     df_050.index = df_050.DNI
     st.write(df_050.shape)
+    MAX_CAT = st.slider('Maximo numero de categorias: ', 10, 30, 20)
     # Depuración de columnas sólo para aquellas que contribuyen al clustering
     col_selec = []
     for col in df_050.columns:
         u_col = df_050[col].unique()
+        if len(u_col) < MAX_CAT:
             col_selec.append(col)
     st.header('Lista de variables que será usada para la clusterización')
         ]
         enfoqueX['HexDens'] = 'Hex_'+str(c)
         enfoques = pd.concat([enfoques, enfoqueX])
+    st.write(enfoques.columns)
+    enfoques2 = enfoques.drop(columns=['pca_1', 'pca_2'])
+    csv = enfoques2.to_csv(encoding='iso-8859-1')
     st.download_button(
         label="Descargar CSV",
         mime='text/csv'
     )
+    df = enfoques2
     cat_col = df.select_dtypes(include=['object']).columns.tolist()
     df_dummies = pd.get_dummies(df[cat_col])
     percentage_presence = df_dummies.mean()*100
     df2['a'] = result
     df2['b'] = result.index
     df2 = df2.sort_values(by='a', ascending=False)
+    st.write(df2.columns)
     df3 = df2.head(20)
     fig3 = px.line_polar(df3, r='a', theta='b')
     st.plotly_chart(fig3)
         file_name='frecuencias_experimento.csv',
         mime='text/csv'
     )