import streamlit as st
import pandas as pd
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier as ABC
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix


class ada_boost_st:
    def __init__(self, database, test_size=0.2):
        self.database = database
        self.test_size = test_size
        self.desc = r'''
        # **AdaBoost**

        Este algoritmo se basa en ir agrupando otros algoritmos de clasificación, para que en conjunto generen una predicción.

        Asimismo, y a diferencia del algoritmo de Random Forest, es que el **voto** de cada estimador no valen lo mismo, es decir, existe un grado de importancia (**weight**) entre los estimadores que siendo estos ponderados por sus votos es que generan la predicción del algoritmo.

        **Weak Learner (Decision Stump)**

        Es un algoritmo que sencillamente clasifica los datos según un límite (similar a uno de los pasos del algoritmo de Decision Tree)

        **Error**

        - Primera iteración

        $$
        ϵ_{1} = \frac{desaciertos}{N}
        $$

        - A partir de la segunda iteración

        $$
        ϵ_{t} = \sum weights
        $$

        Nota: Si el error es mayor a 0.5, se intercambia la clasificación y se calcula el $error = 1 - error$

        **Weights**

        - Al inicio
        $$
        w_{0} = \frac{1}{N} para cada muestra
        $$

        - Luego

        $$
        w = \frac{w \cdot e^{- αyh(X)}}{\sum w}
        $$

        **Performance**

        $$
        \alpha = 0.5 \cdot log(\frac{1-ϵ_{t}}{ϵ_{t}})
        $$

        **Predicción**

        $$
        y = sign(\sum_{t}^{T} α_{t} \cdot h(X))
        $$

        **Training**

        Se inicializan los pesos de cada muestra en $\frac{1}{N}$

        - Entrenamos a un clasificador débil (se busca la mejor variable y límite para segmentar)
        - Calculamos el error $ϵ_{t} = \sum_{desaciertos} weights$
         - Cambiar el error y la polaridad si este es mayor a 0.5
        - Calcular $\alpha = 0.5 \cdot log(\frac{1 - \epsilon_{t}}{ϵ_{t}})$
        - Actualizar los pesos: $w = \frac{w \cdot e^{- αh(X)}}{Z}$

'''
        self.n_clf = 5

    def params(self):
        self.n_clf = st.slider('Numero de estimadores',
                                    min_value=1,
                                    max_value=15,
                                    value=5)

    def solve(self):
        self.X, self.y = self.database.data, self.database.target
        X_train, X_test, y_train, y_test = train_test_split(self.X, self.y, test_size=self.test_size, random_state=1234)
        self.sklearn_clf = ABC(n_estimators=self.n_clf, random_state=1234)
        self.sklearn_clf.fit(X_train, y_train)
        y_pred = self.sklearn_clf.predict(X_test)
        acc = accuracy_score(y_pred, y_test)

        c1, c2 = st.columns([4, 1])
        c2.metric('Acierto', value=f'{np.round(acc, 2)*100}%')
        df = pd.DataFrame(confusion_matrix(y_pred, y_test))
        labels = self.database.target_names
        df.columns = labels
        df.index = labels
        c1.write('**Confusion Matrix**')
        c1.dataframe(df)

    def visualization(self):
        n_features = int(self.database.data.shape[1])
        self.x_feature = st.slider('Variables en eje x', 1, n_features, 1)
        self.y_feature = st.slider('Variables en eje y', 1, n_features, 2)

        self.X = np.c_[self.database.data[:, self.x_feature-1:self.x_feature], self.database.data[:, self.y_feature-1:self.y_feature]]
        self.y = self.database.target
        X_train, X_test, y_train, y_test = train_test_split(self.X, self.y, test_size=self.test_size, random_state=1234)
        self.sklearn_clf = ABC(n_estimators=self.n_clf, random_state=1234)
        self.sklearn_clf.fit(X_train, y_train)

        x1_min, x1_max = self.X[:, 0].min() - 0.5, self.X[:, 0].max() + 0.5
        x2_min, x2_max = self.X[:, 1].min() - 0.5, self.X[:, 1].max() + 0.5
        h = 0.02 # Salto que vamos dando
        x1_i = np.arange(x1_min, x1_max, h)
        x2_i = np.arange(x2_min, x2_max, h)
        x1_x1, x2_x2 = np.meshgrid(x1_i, x2_i)
        y_pred = self.sklearn_clf.predict(np.c_[x1_x1.ravel(), x2_x2.ravel()])
        y_pred = y_pred.reshape(x1_x1.shape)

        plt.figure(1, figsize=(12, 8))
        plt.pcolormesh(x1_x1, x2_x2, y_pred, cmap=plt.cm.Paired)
        plt.scatter(self.X[:, 0], self.X[:, 1], c=self.y, edgecolors='k', cmap=plt.cm.Paired)
        plt.xlim(x1_x1.min(), x1_x1.max())
        plt.ylim(x2_x2.min(), x2_x2.max())
        return plt.gcf()