Spaces:

Rooobert
/

114-Learning-Project-APP

Running

App Files Files Community

Rooobert commited on 23 days ago

Commit

dd9f8a4

verified ·

1 Parent(s): da1dc34

Update app.py

Browse files

Files changed (1) hide show

app.py +175 -169

app.py CHANGED Viewed

@@ -1,7 +1,6 @@
 import streamlit as st
 import pandas as pd
 import plotly.express as px
-import plotly.graph_objs as go
 import numpy as np
 from datetime import datetime
 from dataclasses import dataclass, field
@@ -18,228 +17,235 @@ def read_google_sheet(sheet_id, sheet_number=0):
         st.error(f"❌ 讀取失敗：{str(e)}")
         return None
 class SurveyAnalyzer:
     """📊 問卷分析類"""
     def __init__(self):
-        # 滿意度欄位名稱
         self.satisfaction_columns = [
-            '１．示範場域提供多元的數位課程與活動',
             '２．示範場域的數位課程與活動對我的生活應用有幫助',
-            '３．示範場域的服務人員親切有禮貌',
             '４．示範場域的服務空間與數位設備友善方便',
             '５．在示範場域可以獲得需要的協助',
             '６．對於示範場域的服務感到滿意'
         ]
-        # 對應的簡短名稱
         self.satisfaction_short_names = [
             '多元課程與活動',
-            '生活應用幫助',
             '服務人員親切',
             '空間設備友善',
             '獲得需要協助',
             '整體服務滿意'
         ]
     def plot_satisfaction_scores(self, df: pd.DataFrame):
-        """📊 示範場域滿意度平均分數圖表"""
-        # 確保所有滿意度欄位都存在
-        existing_columns = [col for col in self.satisfaction_columns if col in df.columns]
-        # 計算平均分數和標準差
-        satisfaction_means = [df[col].mean() for col in existing_columns]
-        satisfaction_stds = [df[col].std() for col in existing_columns]
         # 創建數據框
         satisfaction_df = pd.DataFrame({
-            '滿意度項目': [self.satisfaction_short_names[self.satisfaction_columns.index(col)] for col in existing_columns],
             '平均分數': satisfaction_means,
             '標準差': satisfaction_stds
         })
-        # 排序結果（由高到低）
-        satisfaction_df = satisfaction_df.sort_values(by='平均分數', ascending=False)
-        # 建立顏色漸變映射
-        color_scale = [
-            [0, '#90CAF9'],  # 淺藍色
-            [0.5, '#2196F3'],  # 中藍色
-            [1, '#1565C0']  # 深藍色
-        ]
         # 繪製條形圖
         fig = px.bar(
             satisfaction_df,
             x='滿意度項目',
             y='平均分數',
             error_y='標準差',
-            title='📊 示範場域各項滿意度分析',
             color='平均分數',
-            color_continuous_scale=color_scale,
-            text='平均分數',
-            hover_data={
-                '滿意度項目': True,
-                '平均分數': ':.2f',
-                '標準差': ':.2f'
-            }
         )
         # 調整圖表佈局
         fig.update_layout(
-            font=dict(family="Arial", size=16),
-            title_font=dict(family="Arial Black", size=24),
-            title_x=0.5,  # 標題置中
             xaxis_title="滿意度項目",
             yaxis_title="平均分數",
-            yaxis_range=[0, 5],  # 評分範圍從0開始，視覺上更明顯
-            plot_bgcolor='rgba(240,240,240,0.8)',  # 淺灰色背景
-            paper_bgcolor='white',
-            xaxis_tickangle=-25,  # 斜角標籤，避免重疊
-            margin=dict(l=40, r=40, t=80, b=60),
-            legend_title_text="平均分數",
-            shapes=[
-                # 添加參考線 - 4分線
-                dict(
-                    type='line',
-                    yref='y', y0=4, y1=4,
-                    xref='paper', x0=0, x1=1,
-                    line=dict(color='rgba(220,20,60,0.5)', width=2, dash='dash')
-                )
-            ],
-            annotations=[
-                # 參考線標籤
-                dict(
-                    x=0.02, y=4.1,
-                    xref='paper', yref='y',
-                    text='優良標準 (4分)',
-                    showarrow=False,
-                    font=dict(size=14, color='rgba(220,20,60,0.8)')
-                )
-            ]
         )
         # 調整文字格式
         fig.update_traces(
             texttemplate='%{y:.2f}',
-            textposition='outside',
-            marker_line_color='rgb(8,48,107)',
-            marker_line_width=1.5,
-            opacity=0.85
         )
-        # 計算整體平均滿意度（只計算存在的欄位）
-        overall_satisfaction = df[existing_columns].mean().mean()
-        # 返回圖表和整體滿意度
-        return fig, overall_satisfaction, len(df)
-    def analyze_demographic_data(self, df: pd.DataFrame):
-        """分析性別和教育程度"""
-        # 性別分佈
-        if '性別' in df.columns:
-            gender_counts = df['性別'].value_counts()
-            gender_pie = go.Figure(data=[go.Pie(
-                labels=gender_counts.index,
-                values=gender_counts.values,
-                hole=.3,
-                title='性別分佈'
-            )])
-            gender_pie.update_layout(title='📊 性別分佈')
-        else:
-            gender_pie = None
-            st.warning("資料中缺少性別欄位")
-        # 教育程度分佈
-        if '教育程度' in df.columns:
-            education_counts = df['教育程度'].value_counts()
-            education_bar = go.Figure(data=[go.Bar(
-                x=education_counts.index,
-                y=education_counts.values,
-                text=education_counts.values,
-                textposition='auto'
-            )])
-            education_bar.update_layout(
-                title='📊 教育程度分佈',
-                xaxis_title='教育程度',
-                yaxis_title='人數'
-            )
-        else:
-            education_bar = None
-            st.warning("資料中缺少教育程度欄位")
-        return gender_pie, education_bar
 def main():
-    st.set_page_config(page_title="示範場域滿意度調查", layout="wide")
-    # 讀取 Google Sheet 數據
-    sheet_id = "1Wc15DZWq48MxL7nXAsROJ6sRvH5njSa1ea0aaOGUOVk"
-    gid = "1168424766"
     df = read_google_sheet(sheet_id, gid)
     if df is not None:
-        # 創建分析器
         analyzer = SurveyAnalyzer()
-        # 顯示標題
-        st.title("📊 示範場域滿意度調查分析")
-        # 提示缺少的滿意度欄位
-        missing_columns = [col for col in analyzer.satisfaction_columns if col not in df.columns]
-        if missing_columns:
-            st.warning(f"⚠️ 缺少以下滿意度欄位: {missing_columns}")
-        # 繪製滿意度圖表
-        satisfaction_fig, overall_satisfaction, num_respondents = analyzer.plot_satisfaction_scores(df)
-        # 顯示滿意度圖表
-        st.plotly_chart(satisfaction_fig, use_container_width=True)
-        # 顯示整體滿意度
-        st.markdown(f"""
-        ### 📈 整體滿意度分析
-        - **受訪人數**: {num_respondents} 人
-        - **整體平均滿意度**: {overall_satisfaction:.2f} 分
-        #### 🔍 滿意度解讀
-        - 0-1分: 非常不滿意
-        - 1-2分: 不滿意
-        - 2-3分: 普通
-        - 3-4分: 滿意
-        - 4-5分: 非常滿意
-        根據調查結果，整體滿意度為 {overall_satisfaction:.2f} 分，
-        """, unsafe_allow_html=True)
-        # 根據整體滿意度提供文字解讀
-        if overall_satisfaction < 2:
-            st.warning("⚠️ 整體滿意度較低，建議深入檢討服務品質")
-        elif overall_satisfaction < 3:
-            st.info("ℹ️ 整體滿意度處於普通水平，可以進一步改善服務")
-        elif overall_satisfaction < 4:
-            st.success("✅ 整體滿意度良好，但仍有提升空間")
         else:
-            st.balloons()
-            st.success("🎉 整體滿意度非常高，表現優異！")
-        # 人口統計分析
-        st.header("👥 人口統計分析")
-        # 創建兩列顯示
-        col1, col2 = st.columns(2)
-        # 性別分佈
-        with col1:
-            gender_pie, _ = analyzer.analyze_demographic_data(df)
-            if gender_pie:
-                st.plotly_chart(gender_pie, use_container_width=True)
-        # 教育程度分佈
-        with col2:
-            _, education_bar = analyzer.analyze_demographic_data(df)
-            if education_bar:
-                st.plotly_chart(education_bar, use_container_width=True)
 if __name__ == "__main__":
     main()

 import streamlit as st
 import pandas as pd
 import plotly.express as px
 import numpy as np
 from datetime import datetime
 from dataclasses import dataclass, field
         st.error(f"❌ 讀取失敗：{str(e)}")
         return None
+# 📊 Google Sheets ID
+sheet_id = "1Wc15DZWq48MxL7nXAsROJ6sRvH5njSa1ea0aaOGUOVk"
+gid = "1168424766"
+@dataclass
+class SurveyMappings:
+    """📋 問卷數據對應"""
+    gender: Dict[str, int] = field(default_factory=lambda: {'男性': 1, '女性': 2})
+    education: Dict[str, int] = field(default_factory=lambda: {
+        '國小(含)以下': 1, '國/初中': 2, '高中/職': 3, '專科': 4, '大學': 5, '研究所(含)以上': 6})
+    frequency: Dict[str, int] = field(default_factory=lambda: {
+        '第1次': 1, '2-3次': 2, '4-6次': 3, '6次以上': 4, '經常來學習，忘記次數了': 5})
 class SurveyAnalyzer:
     """📊 問卷分析類"""
     def __init__(self):
+        self.mappings = SurveyMappings()
         self.satisfaction_columns = [
+            '１． 示範場域提供多元的數位課程與活動',
             '２．示範場域的數位課程與活動對我的生活應用有幫助',
+            '３． 示範場域的服務人員親切有禮貌',
             '４．示範場域的服務空間與數位設備友善方便',
             '５．在示範場域可以獲得需要的協助',
             '６．對於示範場域的服務感到滿意'
         ]
         self.satisfaction_short_names = [
             '多元課程與活動',
+            '生活應用有幫助',
             '服務人員親切',
             '空間設備友善',
             '獲得需要協助',
             '整體服務滿意'
         ]
+    def calculate_age(self, birth_year_column):
+        """🔢 計算年齡（從民國年到實際年齡）"""
+        # 獲取當前年份（西元年）
+        current_year = datetime.now().year
+        # 將 NaN 或無效值處理為 NaN
+        birth_years = pd.to_numeric(birth_year_column, errors='coerce')
+        # 民國年份轉西元年份 (民國年+1911=西元年)
+        western_years = birth_years + 1911
+        # 計算年齡
+        ages = current_year - western_years
+        return ages
+    def generate_report(self, df: pd.DataFrame) -> Dict[str, Any]:
+        """📝 生成問卷調查報告"""
+        # 計算年齡
+        ages = self.calculate_age(df['２．出生年（民國__年）'])
+        # 取得教育程度分布（帶計數單位）
+        education_counts = df['３．教育程度'].value_counts().to_dict()
+        education_with_counts = {k: f"{v}人" for k, v in education_counts.items()}
+        # 性別分布（帶計數單位）
+        gender_counts = df['1.   性別'].value_counts().to_dict()
+        gender_with_counts = {k: f"{v}人" for k, v in gender_counts.items()}
+        # 計算每個滿意度項目的平均分數和標準差
+        satisfaction_stats = {}
+        for i, col in enumerate(self.satisfaction_columns):
+            mean_score = df[col].mean()
+            std_dev = df[col].std()
+            satisfaction_stats[self.satisfaction_short_names[i]] = {
+                '平均分數': f"{mean_score:.2f}",
+                '標準差': f"{std_dev:.2f}"
+            }
+        return {
+            '基本統計': {
+                '總受訪人數': len(df),
+                '性別分布': gender_with_counts,
+                '教育程度分布': education_with_counts,
+                '平均年齡': f"{ages.mean():.1f}歲"
+            },
+            '滿意度統計': {
+                '整體平均滿意度': f"{df[self.satisfaction_columns].mean().mean():.2f}",
+                '各項滿意度': satisfaction_stats
+            }
+        }
     def plot_satisfaction_scores(self, df: pd.DataFrame):
+        """📊 各項滿意度平均分數圖表"""
+        # 準備數據
+        satisfaction_means = [df[col].mean() for col in self.satisfaction_columns]
+        satisfaction_stds = [df[col].std() for col in self.satisfaction_columns]
         # 創建數據框
         satisfaction_df = pd.DataFrame({
+            '滿意度項目': self.satisfaction_short_names,
             '平均分數': satisfaction_means,
             '標準差': satisfaction_stds
         })
         # 繪製條形圖
         fig = px.bar(
             satisfaction_df,
             x='滿意度項目',
             y='平均分數',
             error_y='標準差',
+            title='📊 各項滿意度平均分數與標準差',
             color='平均分數',
+            color_continuous_scale='Viridis',
+            text='平均分數'
         )
         # 調整圖表佈局
         fig.update_layout(
+            font=dict(size=16),
+            title_font=dict(size=24),
             xaxis_title="滿意度項目",
             yaxis_title="平均分數",
+            yaxis_range=[1, 5],  # 假設評分範圍是 1-5
         )
         # 調整文字格式
         fig.update_traces(
             texttemplate='%{y:.2f}',
+            textposition='outside'
         )
+        st.plotly_chart(fig, use_container_width=True)
+    def plot_gender_distribution(self, df: pd.DataFrame, venues=None, month=None):
+        """🟠 性別分佈圓餅圖（使用藍色和紅色）"""
+        # 過濾數據
+        filtered_df = df.copy()
+        if venues and '全部' not in venues:
+            filtered_df = filtered_df[filtered_df['場域名稱'].isin(venues)]
+        if month and month != '全部':
+            # 假設有一個月份欄位，如果沒有請調整
+            filtered_df = filtered_df[filtered_df['月份'] == month]
+        gender_counts = filtered_df['1.   性別'].value_counts().reset_index()
+        gender_counts.columns = ['性別', '人數']
+        # 計算百分比
+        total = gender_counts['人數'].sum()
+        gender_counts['百分比'] = (gender_counts['人數'] / total * 100).round(1)
+        gender_counts['標籤'] = gender_counts.apply(lambda x: f"{x['性別']}: {x['人數']}人 ({x['百分比']}%)", axis=1)
+        # 設定顏色映射 - 男性藍色，女性紅色
+        color_map = {'男性': '#2171b5', '女性': '#cb181d'}
+        fig = px.pie(
+            gender_counts,
+            names='性別',
+            values='人數',
+            title='🟠 受訪者性別分布',
+            color='性別',
+            color_discrete_map=color_map,
+            hover_data=['人數', '百分比'],
+            labels={'人數': '人數', '百分比': '百分比'},
+            custom_data=['標籤']
+        )
+        # 更新悬停信息
+        fig.update_traces(
+            textinfo='percent+label',
+            hovertemplate='%{customdata[0]}'
+        )
+        st.plotly_chart(fig, use_container_width=True)
+# 🎨 Streamlit UI
 def main():
+    st.set_page_config(page_title="問卷調查分析", layout="wide")
+    st.title("📊 問卷調查分析報告")
+    st.write("本頁面展示問卷調查數據的分析結果，包括統計信息與視覺化圖表。")
+    # 讀取數據
     df = read_google_sheet(sheet_id, gid)
     if df is not None:
         analyzer = SurveyAnalyzer()
+        # 新增場域和月份篩選器
+        st.sidebar.header("🔍 數據篩選")
+        # 假設數據有「場域名稱」欄位，如果名稱不同請調整
+        if '場域名稱' in df.columns:
+            venues = ['全部'] + sorted(df['場域名稱'].unique().tolist())
+            selected_venues = st.sidebar.multiselect("選擇場域", venues, default=['全部'])
+        else:
+            # 如果沒有場域欄位，創建10個虛擬場域供選擇
+            venues = ['全部'] + [f'場域{i+1}' for i in range(10)]
+            selected_venues = st.sidebar.multiselect("選擇場域", venues, default=['全部'])
+        # 假設數據有「月份」欄位，如果沒有請調整
+        if '月份' in df.columns:
+            months = ['全部'] + sorted(df['月份'].unique().tolist())
+            selected_month = st.sidebar.selectbox("選擇月份", months)
         else:
+            # 如果沒有月份欄位，可以創建虛擬月份選項
+            months = ['全部'] + [f'{i+1}月' for i in range(12)]
+            selected_month = st.sidebar.selectbox("選擇月份", months)
+        # 📌 基本統計數據
+        st.sidebar.header("📌 選擇數據分析")
+        selected_analysis = st.sidebar.radio("選擇要查看的分析",
+                                             ["📋 問卷統計報告", "📊 滿意度統計", "🟠 性別分佈"])
+        if selected_analysis == "📋 問卷統計報告":
+            st.header("📋 問卷統計報告")
+            report = analyzer.generate_report(df)
+            for category, stats in report.items():
+                with st.expander(f"🔍 {category}", expanded=True):
+                    for key, value in stats.items():
+                        if key == '各項滿意度':
+                            st.write(f"**{key}:**")
+                            for item, item_stats in value.items():
+                                st.write(f"  - **{item}**: {', '.join([f'{k}: {v}' for k, v in item_stats.items()])}")
+                        else:
+                            st.write(f"**{key}**: {value}")
+        elif selected_analysis == "📊 滿意度統計":
+            st.header("📊 滿意度統計")
+            analyzer.plot_satisfaction_scores(df)
+        elif selected_analysis == "🟠 性別分佈":
+            st.header("🟠 性別分佈")
+            analyzer.plot_gender_distribution(df, selected_venues, selected_month)
 if __name__ == "__main__":
     main()