Upload 4 files
Browse files- static/styles.css +24 -0
- templates/index.html +34 -5
static/styles.css
CHANGED
|
@@ -56,6 +56,25 @@ h1 { margin: 0 0 4px; font-size: 28px; }
|
|
| 56 |
|
| 57 |
.card-header .title { font-weight: 600; }
|
| 58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 59 |
.search {
|
| 60 |
appearance: none;
|
| 61 |
border: 1px solid var(--border);
|
|
@@ -99,6 +118,11 @@ td[data-label="Rank"], th:first-child {
|
|
| 99 |
color: #cfe2ff;
|
| 100 |
}
|
| 101 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 102 |
/* Keep model names on a single line */
|
| 103 |
td[data-label="Model"] {
|
| 104 |
white-space: nowrap;
|
|
|
|
| 56 |
|
| 57 |
.card-header .title { font-weight: 600; }
|
| 58 |
|
| 59 |
+
.explainer {
|
| 60 |
+
padding: 16px 18px;
|
| 61 |
+
border-bottom: 1px solid var(--border);
|
| 62 |
+
color: var(--muted);
|
| 63 |
+
}
|
| 64 |
+
|
| 65 |
+
.explainer p { margin: 0 0 10px; }
|
| 66 |
+
|
| 67 |
+
.explainer pre {
|
| 68 |
+
background: #0c1322;
|
| 69 |
+
border: 1px solid var(--border);
|
| 70 |
+
border-radius: 10px;
|
| 71 |
+
padding: 12px 14px;
|
| 72 |
+
overflow: auto;
|
| 73 |
+
color: var(--text);
|
| 74 |
+
}
|
| 75 |
+
|
| 76 |
+
.explainer code { font-family: ui-monospace, SFMono-Regular, Menlo, Monaco, Consolas, "Liberation Mono", "Courier New", monospace; font-size: 13px; }
|
| 77 |
+
|
| 78 |
.search {
|
| 79 |
appearance: none;
|
| 80 |
border: 1px solid var(--border);
|
|
|
|
| 118 |
color: #cfe2ff;
|
| 119 |
}
|
| 120 |
|
| 121 |
+
/* Bold the "Rank(out of 2.5M)" column and header */
|
| 122 |
+
td[data-label="Rank(out of 2.5M)"], th[data-label="Rank(out of 2.5M)"] {
|
| 123 |
+
font-weight: 700;
|
| 124 |
+
}
|
| 125 |
+
|
| 126 |
/* Keep model names on a single line */
|
| 127 |
td[data-label="Model"] {
|
| 128 |
white-space: nowrap;
|
templates/index.html
CHANGED
|
@@ -15,14 +15,13 @@
|
|
| 15 |
<body>
|
| 16 |
<header class="page-header" id="site-header">
|
| 17 |
<div class="container">
|
| 18 |
-
<h1>YKS LLM Leaderboard</h1>
|
| 19 |
</div>
|
| 20 |
</header>
|
| 21 |
|
| 22 |
<main class="container">
|
| 23 |
<div class="card">
|
| 24 |
<div class="card-header">
|
| 25 |
-
<div class="title">Results</div>
|
| 26 |
<div class="actions">
|
| 27 |
<input
|
| 28 |
id="search"
|
|
@@ -33,12 +32,43 @@
|
|
| 33 |
/>
|
| 34 |
</div>
|
| 35 |
</div>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 36 |
<div class="table-wrapper">
|
| 37 |
<table id="leaderboard" class="table">
|
| 38 |
<thead>
|
| 39 |
<tr>
|
| 40 |
{% for h in headers %}
|
| 41 |
-
<th onclick="sortTable({{ loop.index0 }})">
|
|
|
|
|
|
|
| 42 |
{% endfor %}
|
| 43 |
</tr>
|
| 44 |
</thead>
|
|
@@ -56,8 +86,7 @@
|
|
| 56 |
</div>
|
| 57 |
</main>
|
| 58 |
|
| 59 |
-
<footer class="footer container">
|
| 60 |
-
</footer>
|
| 61 |
|
| 62 |
<script>
|
| 63 |
function filterTable() {
|
|
|
|
| 15 |
<body>
|
| 16 |
<header class="page-header" id="site-header">
|
| 17 |
<div class="container">
|
| 18 |
+
<h1>YKS 2025 LLM Leaderboard</h1>
|
| 19 |
</div>
|
| 20 |
</header>
|
| 21 |
|
| 22 |
<main class="container">
|
| 23 |
<div class="card">
|
| 24 |
<div class="card-header">
|
|
|
|
| 25 |
<div class="actions">
|
| 26 |
<input
|
| 27 |
id="search"
|
|
|
|
| 32 |
/>
|
| 33 |
</div>
|
| 34 |
</div>
|
| 35 |
+
<div class="explainer">
|
| 36 |
+
<p>
|
| 37 |
+
Bu Leaderboard'da çeşitli LLM'lerin YKS 2025 sınavındaki başarıları
|
| 38 |
+
ölçülmüştür. Modellere sınavın iki aşaması olan TYT ve AYT'deki tüm
|
| 39 |
+
sorular çözdürülmüş ve doğru cevap sayılarına puan ve sınava giren
|
| 40 |
+
2.5 milyon aday arasından tahmini sıralamaları hesaplanmıştır.
|
| 41 |
+
Modellerin maksimum potansiyelini görmek için sorular görsel olarak
|
| 42 |
+
verilmiştir.
|
| 43 |
+
</p>
|
| 44 |
+
<p>
|
| 45 |
+
<strong>Metodoloji:</strong> Her bir soru modellere bu prompt ile
|
| 46 |
+
verilmiştir.
|
| 47 |
+
</p>
|
| 48 |
+
<pre><code>Verilen çoktan seçmeli soruyu cevapla. Cevabın sonunda hangi şıkkı seçtiğini net olarak belirt.
|
| 49 |
+
{soru_görseli)
|
| 50 |
+
</code></pre>
|
| 51 |
+
<p>
|
| 52 |
+
Ardından modellerin verdiği bu formattaki yanıt'tan başka bir LLM
|
| 53 |
+
ile cevap şıkkı elde edilmiştir.
|
| 54 |
+
</p>
|
| 55 |
+
<pre><code>Etanın iki ucuna sırasıyla etil ve izopropil grupları bağlanınca toplam 7 karbonlu bir isomer oluşur. En uzun karbon zinciri 6 karbonludur; numaralandırma yapıldığında tek substitüent olarak C-2’de bir metil grubu kalır. Bu nedenle IUPAC adı 2-Metilheksan’dır.
|
| 56 |
+
|
| 57 |
+
Seçtiğim şık: E) 2-Metilheksan
|
| 58 |
+
</code></pre>
|
| 59 |
+
<p>
|
| 60 |
+
Modelin cevabının "E" olduğu tespit edilmiş ve cevap
|
| 61 |
+
anahtarı ile karşılaştırılmıştır.
|
| 62 |
+
</p>
|
| 63 |
+
</div>
|
| 64 |
<div class="table-wrapper">
|
| 65 |
<table id="leaderboard" class="table">
|
| 66 |
<thead>
|
| 67 |
<tr>
|
| 68 |
{% for h in headers %}
|
| 69 |
+
<th data-label="{{ h }}" onclick="sortTable({{ loop.index0 }})">
|
| 70 |
+
{{ h }}
|
| 71 |
+
</th>
|
| 72 |
{% endfor %}
|
| 73 |
</tr>
|
| 74 |
</thead>
|
|
|
|
| 86 |
</div>
|
| 87 |
</main>
|
| 88 |
|
| 89 |
+
<footer class="footer container"></footer>
|
|
|
|
| 90 |
|
| 91 |
<script>
|
| 92 |
function filterTable() {
|