alibayram's picture
Refactor Gradio app to support Turkish localization, enhance UI with modern design elements, and improve data management with comprehensive error handling. Update configuration settings for better clarity and usability.
9b0ae85
import logging
import time
from functools import lru_cache
from typing import Dict, List, Optional, Tuple
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from data_manager import data_manager
logger = logging.getLogger(__name__)
@lru_cache(maxsize=128)
def filter_leaderboard(
family: Optional[str] = None,
quantization_level: Optional[str] = None
) -> pd.DataFrame:
"""Önbellekleme ile kriterlere göre liderlik tablosu verilerini filtrele."""
try:
df = data_manager.leaderboard_data.copy()
if df.empty:
logger.warning("Liderlik tablosu verileri boş, boş DataFrame döndürülüyor")
return pd.DataFrame()
# Filtreleri uygula
if family and family != "Tümü":
df = df[df["family"] == family]
if quantization_level and quantization_level != "Tümü":
df = df[df["quantization_level"] == quantization_level]
# Puan varsa sırala
if "score" in df.columns:
df = df.sort_values("score", ascending=False)
# Sıralama ekle
if not df.empty and "score" in df.columns:
df = df.reset_index(drop=True)
df.insert(0, "Sıra", range(1, len(df) + 1))
return df
except Exception as e:
logger.error(f"Liderlik tablosu filtreleme hatası: {e}")
return pd.DataFrame()
def get_all_responses(model: str = None, page: int = 1, page_size: int = 50) -> pd.DataFrame:
"""Sayfalama ile arama sorgusu olmadan göz atmak için tüm model cevaplarını al."""
try:
df = data_manager.responses_data
if df.empty:
logger.warning("Cevap verileri boş, boş DataFrame döndürülüyor")
return pd.DataFrame({"ℹ️ Bilgi": ["Cevap verisi mevcut değil. Lütfen veri yüklemeyi kontrol edin."]})
# Hata ayıklama: Mevcut sütunları göster
logger.info(f"Cevap verilerindeki mevcut sütunlar: {list(df.columns)}")
# Gerekli sütunların var olup olmadığını kontrol et
required_columns = ["bolum", "soru", "cevap"]
missing_columns = [col for col in required_columns if col not in df.columns]
if missing_columns:
return pd.DataFrame({
"❌ Hata": [f"Eksik gerekli sütunlar: {', '.join(missing_columns)}"],
"Mevcut Sütunlar": [", ".join(df.columns.tolist())]
})
# Tüm mevcut modelleri al
available_models = [col.replace("_cevap", "") for col in df.columns if col.endswith("_cevap")]
if not available_models:
return pd.DataFrame({
"ℹ️ Bilgi": ["Model cevap sütunları bulunamadı."],
"Mevcut Sütunlar": [", ".join(df.columns.tolist())]
})
# Sayfalamayı hesapla
total_rows = len(df)
start_idx = (page - 1) * page_size
end_idx = start_idx + page_size
# Sayfa numarasını doğrula
if start_idx >= total_rows:
return pd.DataFrame({
"ℹ️ Bilgi": [f"Sayfa {page} aralığın dışında. Toplam sayfa: {(total_rows + page_size - 1) // page_size}"]
})
# Mevcut sayfa için veri dilimini al
df_page = df.iloc[start_idx:end_idx].copy()
# Belirli bir model seçilmemişse, tüm modeller için cevapları göster
if not model or model.strip() == "":
# İlgili sütunları seç
display_columns = ["bolum", "soru", "cevap"] + [f"{m}_cevap" for m in available_models if f"{m}_cevap" in df_page.columns]
result_df = df_page[display_columns]
# Daha iyi görünüm için sütunları yeniden adlandır
column_mapping = {
"bolum": "📚 Bölüm",
"soru": "❓ Soru",
"cevap": "✅ Doğru Cevap"
}
for model_name in available_models:
model_col = f"{model_name}_cevap"
if model_col in result_df.columns:
column_mapping[model_col] = f"🤖 {model_name}"
result_df = result_df.rename(columns=column_mapping)
else:
# Belirli model için cevapları göster
model_column = f"{model}_cevap"
if model_column not in df.columns:
return pd.DataFrame({
"❌ Hata": [f"'{model}' modeli cevapları bulunamadı."],
"🤖 Mevcut Modeller": [", ".join(available_models[:10]) + ("..." if len(available_models) > 10 else "")],
"💡 İpucu": ["Lütfen cevap verisi olan açılır menüden bir model seçin."]
})
# Görüntülenecek sütunları seç ve hazırla
selected_columns = ["bolum", "soru", "cevap", model_column]
result_df = df_page[selected_columns]
# Daha iyi görünüm için sütunları yeniden adlandır
result_df = result_df.rename(columns={
"bolum": "📚 Bölüm",
"soru": "❓ Soru",
"cevap": "✅ Doğru Cevap",
model_column: f"🤖 {model} Cevabı"
})
# Eksik değerleri işle
result_df = result_df.fillna("N/A")
# Genel soru numaralarını ekle (sadece sayfa numaraları değil)
global_question_numbers = range(start_idx + 1, start_idx + len(result_df) + 1)
result_df.insert(0, "📝 Soru #", global_question_numbers)
return result_df
except Exception as e:
logger.error(f"Tüm cevapları alma hatası: {e}")
return pd.DataFrame({
"❌ Hata": [f"Cevapları yükleme hatası: {str(e)}"],
"🔧 Hata Ayıklama Bilgisi": [f"Model: '{model}', Sayfa: {page}"]
})
def get_pagination_info(page: int = 1, page_size: int = 50) -> dict:
"""Cevap verileri için sayfalama bilgilerini al."""
try:
df = data_manager.responses_data
total_rows = len(df)
total_pages = (total_rows + page_size - 1) // page_size
start_idx = (page - 1) * page_size + 1
end_idx = min(page * page_size, total_rows)
return {
"current_page": page,
"total_pages": total_pages,
"total_rows": total_rows,
"page_size": page_size,
"start_idx": start_idx,
"end_idx": end_idx,
"has_prev": page > 1,
"has_next": page < total_pages
}
except Exception as e:
logger.error(f"Sayfalama bilgisi alma hatası: {e}")
return {
"current_page": 1,
"total_pages": 1,
"total_rows": 0,
"page_size": page_size,
"start_idx": 1,
"end_idx": 0,
"has_prev": False,
"has_next": False
}
def search_responses(query: str, model: str, page: int = 1, page_size: int = 50) -> pd.DataFrame:
"""Geliştirilmiş işlevsellik ile sorguya göre model cevaplarını ara."""
try:
# Sorgu sağlanmazsa, tüm cevapları göster
if not query or not query.strip():
return get_all_responses(model, page, page_size)
if not model or not model.strip():
return pd.DataFrame({"ℹ️ Bilgi": ["Lütfen açılır menüden bir model seçin."]})
query = query.strip()
model = model.strip()
df = data_manager.responses_data
if df.empty:
logger.warning("Cevap verileri boş, boş DataFrame döndürülüyor")
return pd.DataFrame({"ℹ️ Bilgi": ["Cevap verisi mevcut değil. Lütfen veri yüklemeyi kontrol edin."]})
# Gerekli sütunların varlığını kontrol et
required_columns = ["bolum", "soru", "cevap"]
for col in required_columns:
if col not in df.columns:
return pd.DataFrame({
"❌ Hata": [f"Gerekli sütun '{col}' bulunamadı"],
"Mevcut Sütunlar": [", ".join(df.columns.tolist())]
})
# Model sütununun varlığını kontrol et
model_column = f"{model}_cevap"
if model_column not in df.columns:
available_models = [col.replace("_cevap", "") for col in df.columns if col.endswith("_cevap")]
return pd.DataFrame({
"❌ Hata": [f"'{model}' modeli cevapları bulunamadı"],
"🤖 Mevcut Modeller": [", ".join(available_models[:10]) + ("..." if len(available_models) > 10 else "")],
"💡 Öneriler": [
"1. Açılır menüden geçerli bir model seçin",
"2. Model verilerinin yüklendiğinden emin olun",
"3. Modelleri yenilemek için 'Yenile' butonuna tıklayın"
]
})
# Sorguyu güvenli hale getir (büyük/küçük harf duyarsız)
query_lower = query.lower()
# Birden fazla sütunda arama yap
search_columns = ["bolum", "soru", "cevap", model_column]
search_mask = pd.Series([False] * len(df))
for col in search_columns:
if col in df.columns:
# Güvenli string dönüştürme ve büyük/küçük harf duyarsız arama
col_mask = df[col].astype(str).str.lower().str.contains(query_lower, case=False, na=False, regex=False)
search_mask = search_mask | col_mask
# Arama sonuçlarını filtrele
search_results = df[search_mask]
if search_results.empty:
return pd.DataFrame({
"🔍 Arama Sonucu": [f"'{query}' için sonuç bulunamadı"],
"💡 İpucu": [
"Daha genel terimler deneyin",
"Yazım hatalarını kontrol edin",
"Farklı anahtar kelimeler kullanın"
],
"📊 Aranan Sütunlar": [", ".join(search_columns)]
})
# Sonuçları sayıyla sınırla (performans için)
max_results = 50
if len(search_results) > max_results:
search_results = search_results.head(max_results)
truncated_message = f" (İlk {max_results} sonuç gösteriliyor)"
else:
truncated_message = ""
# Görüntülenecek sütunları seç
display_columns = ["bolum", "soru", "cevap", model_column]
result_df = search_results[display_columns].copy()
# Sütunları yeniden adlandır
result_df = result_df.rename(columns={
"bolum": "📚 Bölüm",
"soru": "❓ Soru",
"cevap": "✅ Doğru Cevap",
model_column: f"🤖 {model} Cevabı"
})
# Eksik değerleri işle
result_df = result_df.fillna("N/A")
# Başlık satırı ekle
summary_info = f"'{query}' için {len(search_results)} sonuç{truncated_message}"
result_df.insert(0, "🔍 Arama Özeti", [summary_info] + [""] * (len(result_df) - 1))
return result_df
except Exception as e:
logger.error(f"Cevap arama hatası: {e}")
error_details = f"Sorgu: '{query}', Model: '{model}', Hata: {str(e)}"
return pd.DataFrame({
"❌ Arama Hatası": ["Arama sırasında bir hata oluştu"],
"🔧 Hata Detayları": [error_details],
"💡 Öneriler": [
"Basit sorgu terimleri deneyin",
"Özel karakterleri kaldırın",
"Sayfayı yenileyin ve tekrar deneyin"
]
})
def create_plotly_section_results() -> go.Figure:
"""Bölüm sonuçları için etkileşimli Plotly grafiği oluştur."""
try:
df = data_manager.section_results_data
if df.empty:
fig = go.Figure()
fig.add_annotation(
text="Bölüm verisi mevcut değil",
xref="paper", yref="paper",
x=0.5, y=0.5, xanchor='center', yanchor='middle',
showarrow=False,
font=dict(size=16, color="gray")
)
fig.update_layout(
title="Bölüm Performans Analizi",
height=500,
plot_bgcolor='white',
paper_bgcolor='white'
)
return fig
# İlk sütunun bölüm adları olduğunu varsay
if len(df.columns) < 2:
fig = go.Figure()
fig.add_annotation(
text="Yeterli veri yok",
xref="paper", yref="paper",
x=0.5, y=0.5, xanchor='center', yanchor='middle',
showarrow=False,
font=dict(size=16, color="gray")
)
fig.update_layout(title="Bölüm Performans Analizi", height=500)
return fig
# Sayısal sütunları (model performansları) al
numeric_columns = df.select_dtypes(include=['number']).columns.tolist()
section_column = df.columns[0] if df.columns[0] not in numeric_columns else 'section'
if not numeric_columns:
# Sayısal sütun yoksa ilk sütunu bölüm olarak al ve diğerlerini sayısala çevirmeye çalış
numeric_columns = df.columns[1:].tolist()
for col in numeric_columns:
df[col] = pd.to_numeric(df[col], errors='coerce')
# Etkileşimli bar chart oluştur
fig = go.Figure()
# Her model için ayrı çubuk ekle
colors = px.colors.qualitative.Set3
for i, model in enumerate(numeric_columns):
fig.add_trace(go.Bar(
name=model,
x=df[section_column] if section_column in df.columns else df.index,
y=df[model],
marker_color=colors[i % len(colors)],
text=[f'{v:.1f}%' if pd.notna(v) else 'N/A' for v in df[model]],
textposition='auto',
hovertemplate=f'<b>{model}</b><br>Bölüm: %{{x}}<br>Puan: %{{y:.1f}}%<extra></extra>'
))
fig.update_layout(
title="Model Performanslarının Bölümlere Göre Karşılaştırması",
xaxis_title="Bölümler",
yaxis_title="Doğruluk Puanı (%)",
height=500,
plot_bgcolor='white',
paper_bgcolor='white',
barmode='group',
hovermode='x unified',
legend=dict(
orientation="h",
yanchor="bottom",
y=1.02,
xanchor="right",
x=1
)
)
# Grid ekle
fig.update_xaxes(showgrid=True, gridwidth=1, gridcolor='lightgray')
fig.update_yaxes(showgrid=True, gridwidth=1, gridcolor='lightgray')
return fig
except Exception as e:
logger.error(f"Bölüm sonuçları grafiği oluşturma hatası: {e}")
fig = go.Figure()
fig.add_annotation(
text=f"Grafik oluşturma hatası: {str(e)}",
xref="paper", yref="paper",
x=0.5, y=0.5, xanchor='center', yanchor='middle',
showarrow=False,
font=dict(size=14, color="red")
)
fig.update_layout(
title="Bölüm Performans Analizi",
height=500,
plot_bgcolor='white',
paper_bgcolor='white'
)
return fig
def validate_model_submission(
model_name: str,
base_model: str,
revision: str,
precision: str,
weight_type: str,
model_type: str
) -> Tuple[bool, str]:
"""Model gönderimini detaylı kontrollerle doğrula."""
try:
# Temel validasyon
if not model_name or not model_name.strip():
return False, "Model adı gereklidir"
if not base_model or not base_model.strip():
return False, "Temel model gereklidir"
# İsim formatını kontrol et
model_name = model_name.strip()
if len(model_name) < 3:
return False, "Model adı en az 3 karakter olmalıdır"
if len(model_name) > 100:
return False, "Model adı 100 karakterden fazla olamaz"
# Özel karakterleri kontrol et
if not model_name.replace('-', '').replace('_', '').replace('.', '').replace('/', '').isalnum():
return False, "Model adında sadece harf, rakam, tire, alt çizgi, nokta ve eğik çizgi kullanılabilir"
# Mevcut modellerde çakışma kontrolü
existing_data = data_manager.leaderboard_data
if not existing_data.empty and 'model' in existing_data.columns:
if model_name.lower() in existing_data['model'].str.lower().values:
return False, f"'{model_name}' adında bir model zaten mevcut"
# Temel model formatını kontrol et
base_model = base_model.strip()
if '/' not in base_model and not base_model.startswith('http'):
return False, "Temel model formatı 'organization/model' şeklinde olmalıdır"
# Revizyon kontrolü
if revision and len(revision.strip()) > 50:
return False, "Revizyon 50 karakterden fazla olamaz"
# Yapılandırma seçeneklerini kontrol et
from config import CONFIG
if precision not in CONFIG["model"].precision_options:
return False, f"Geçersiz hassasiyet seçimi. Geçerli seçenekler: {', '.join(CONFIG['model'].precision_options)}"
if weight_type not in CONFIG["model"].weight_types:
return False, f"Geçersiz ağırlık türü seçimi. Geçerli seçenekler: {', '.join(CONFIG['model'].weight_types)}"
if model_type not in CONFIG["model"].model_types:
return False, f"Geçersiz model türü seçimi. Geçerli seçenekler: {', '.join(CONFIG['model'].model_types)}"
# Başarılı validasyon
success_message = f"Model '{model_name}' başarıyla doğrulandı ve değerlendirme kuyruğuna eklendi"
logger.info(f"Model gönderimi doğrulandı: {model_name}")
return True, success_message
except Exception as e:
logger.error(f"Model doğrulama hatası: {e}")
return False, f"Doğrulama sırasında hata oluştu: {str(e)}"
def get_leaderboard_stats() -> Dict[str, any]:
"""Liderlik tablosu istatistiklerini al."""
try:
df = data_manager.leaderboard_data
if df.empty:
return {
"toplam_model": 0,
"ortalama_puan": 0,
"en_yuksek_puan": 0,
"aileler": [],
"kuantizasyon_seviyeleri": []
}
stats = {
"toplam_model": len(df),
"ortalama_puan": df["score"].mean() if "score" in df.columns else 0,
"en_yuksek_puan": df["score"].max() if "score" in df.columns else 0,
"aileler": df["family"].unique().tolist() if "family" in df.columns else [],
"kuantizasyon_seviyeleri": df["quantization_level"].unique().tolist() if "quantization_level" in df.columns else []
}
return stats
except Exception as e:
logger.error(f"İstatistik alma hatası: {e}")
return {
"toplam_model": 0,
"ortalama_puan": 0,
"en_yuksek_puan": 0,
"aileler": [],
"kuantizasyon_seviyeleri": []
}
def format_dataframe_for_display(df: pd.DataFrame, max_rows: int = 100) -> pd.DataFrame:
"""DataFrame'i görüntüleme için formatla."""
try:
if df.empty:
return pd.DataFrame({"ℹ️ Bilgi": ["Görüntülenecek veri yok"]})
# Satır sayısını sınırla
if len(df) > max_rows:
df = df.head(max_rows)
logger.info(f"DataFrame {max_rows} satırla sınırlandırıldı")
# Sayısal sütunları formatla
for col in df.select_dtypes(include=['float']).columns:
if 'score' in col.lower() or 'puan' in col.lower():
df[col] = df[col].round(2)
# Uzun string'leri kısalt
for col in df.select_dtypes(include=['object']).columns:
df[col] = df[col].astype(str).apply(
lambda x: x[:100] + "..." if len(x) > 100 else x
)
return df
except Exception as e:
logger.error(f"DataFrame formatlama hatası: {e}")
return pd.DataFrame({"❌ Hata": [f"Formatlama hatası: {str(e)}"]})
# Önbellekleme temizleme işlevi
def clear_cache():
"""Tüm LRU önbelleklerini temizle."""
try:
filter_leaderboard.cache_clear()
logger.info("Önbellekler temizlendi")
except Exception as e:
logger.error(f"Önbellek temizleme hatası: {e}")
# Veri yenileme sonrası önbellekleri temizle
def refresh_all_caches():
"""Veri yenileme sonrası tüm önbellekleri yenile."""
try:
clear_cache()
# Veri yöneticisinden yeni verileri zorla yükle
data_manager.refresh_datasets()
logger.info("Tüm önbellekler ve veriler yenilendi")
except Exception as e:
logger.error(f"Önbellek yenileme hatası: {e}")