Spaces:

gestiodinamica
/

continental_edusights

Running

App Files Files Community

jcmachicao commited on Jun 19, 2024

Commit

fd0c6b5

verified ·

1 Parent(s): eb133d4

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -3

app.py CHANGED Viewed

@@ -1,3 +1,5 @@
 import streamlit as st
 import pandas as pd
 import numpy as np
@@ -7,6 +9,7 @@ import plotly.express as px
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
 from sklearn.decomposition import PCA
 scaler = StandardScaler()
 st.title("Visualización y Clusterización automática de Data de Estudiantes")
@@ -62,9 +65,12 @@ if uploaded_file is not None:
     st.pyplot(plt)
     st.write(data_200.columns)
-    VIRTU = st.selectbox('Virtual: ', [0, 1])
-    INGRE = st.selectbox('Ingresante: ', [0, 1])
     data_210 = data_200[(data_200['COD_DEPARTAMENTO']==VIRTU) & (data_200['ESTADO_ESTUDIANTE']==INGRE)]
@@ -72,7 +78,7 @@ if uploaded_file is not None:
     st.plotly_chart(fig2)
     plt.figure(figsize=(10, 8))
-    plt_extracto = plt.hexbin(data_200.pca_1, data_200.pca_2, gridsize=50, cmap='inferno')
     plt.colorbar()
     plt.title('Hexbin Plot of PCA-Transformed Data')
     plt.xlabel('Principal Component 1')
@@ -86,4 +92,37 @@ if uploaded_file is not None:
     plt.ylabel('Frecuencia')
     plt.title('Histograma de Densidades')
     st.pyplot(plt)

+# Actualizado por: José Carlos Machicao, Fecha de actualización: 2024_06_19
 import streamlit as st
 import pandas as pd
 import numpy as np
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
 from sklearn.decomposition import PCA
+pd.DataFrame.iteritems = pd.DataFrame.items
 scaler = StandardScaler()
 st.title("Visualización y Clusterización automática de Data de Estudiantes")
     st.pyplot(plt)
     st.write(data_200.columns)
+    #st.write(data_200['COD_DEPARTAMENTO'].unique())
+    #st.write(data_200['ESTADO_ESTUDIANTE'].unique())
+    VIRTU = st.selectbox('Virtual: ', ['UVIR', 'PCGT'])
+    INGRE = st.selectbox('Ingresante: ', ['REGULAR', 'INGRESANTE', 'REINCORPORADO'])
     data_210 = data_200[(data_200['COD_DEPARTAMENTO']==VIRTU) & (data_200['ESTADO_ESTUDIANTE']==INGRE)]
     st.plotly_chart(fig2)
     plt.figure(figsize=(10, 8))
+    plt_extracto = plt.hexbin(data_210.pca_1, data_210.pca_2, gridsize=50, cmap='inferno')
     plt.colorbar()
     plt.title('Hexbin Plot of PCA-Transformed Data')
     plt.xlabel('Principal Component 1')
     plt.ylabel('Frecuencia')
     plt.title('Histograma de Densidades')
     st.pyplot(plt)
+    offsets = plt_extracto.get_offsets()
+    offsets_df = pd.DataFrame(offsets)
+    st.write(offsets_df.shape)
+    offsets_df['densidad'] = densidades[0]
+    offsets_df.columns = ['col1', 'col2', 'densidad']
+    offset_selec = offsets_df.sort_values(by='densidad', ascending=False)
+    patrones_df = pd.DataFrame(index = [0,1,2,3,4,5,6,7,8,9], data=offset_selec.values[0:10], columns=offset_selec.columns)
+    st.write(patrones_df)
+    NUM_CASOS = st.slider("¿Cuántos casos elige explorar?", 1, 10, 3)
+    st.write('Usted ha elegido ', NUM_CASOS, 'casos.')
+    radiohex = (data_210.pca_1.max() - data_210.pca_1.min())/50/2
+    CASOX = st.selectbox('Elija el caso: ', (1, 2, 3))
+    a, b = patrones_df.col1[CASOX], patrones_df.col2[CASOX]
+    enfoqueX = data_210[
+        (data_210.pca_1 > a - radiohex) &
+        (data_210.pca_1 < a + radiohex) &
+        (data_210.pca_2 > b - radiohex) &
+        (data_210.pca_2 < b + radiohex)
+    ]
+    st.write(enfoqueX.shape)
+    LISTA_SELEC = st.multiselect('Escoja la variable de color: ', list(enfoqueX.columns))
+    st.write(LISTA_SELEC)
+    fig2 = px.parallel_categories(data_frame=enfoqueX[list(LISTA_SELEC)])
+    st.plotly_chart(fig2)