Lexu3A
/

llm-course-hw1

Text Generation

model_hub_mixin

pytorch_model_hub_mixin

language-modeling

Model card Files Files and versions Community

Lexu3A commited on Feb 18

Commit

16255ac

·

verified ·

1 Parent(s): bce1cb5

Update README.md

Files changed (1) hide show

README.md +13 -9

README.md CHANGED Viewed

@@ -36,6 +36,8 @@ tags:
   * Linear_head + softmax
   Подробнее можно увидеть на следующей схеме:
 - **Обучение и параметры:**
@@ -44,24 +46,26 @@ tags:
   1) optimizer = AdamW(learning_rate=3e-4, weight_decay=0.01)
   2) scheduler  - Linear schedule with warmup
   3) loss = cross_entropy
-  4)
 ## Данные
 Модель обучалась на следующем датасете:
-- **Название датасета:**
-  Краткое описание датасета, ссылка на источник (если применимо).
-  _Пример:_ обучено на выборке новостных статей с [название ресурса/источника].
-## Оценка качества (Quality Report)
-Для оценки модели были использованы следующие метрики:
-- **Perplexity:** 12.34 (примерное значение)
-- **BLEU/ROUGE:** Если применимо, укажите метрики и результаты.
-При наличии автоматизированного Quality Report можно добавить ссылку на ноутбук или встроить результаты тестирования.
 ## Примеры генерации

   * Linear_head + softmax
   Подробнее можно увидеть на следующей схеме:
 - **Обучение и параметры:**
   1) optimizer = AdamW(learning_rate=3e-4, weight_decay=0.01)
   2) scheduler  - Linear schedule with warmup
   3) loss = cross_entropy
+  4) Num_steps = 10_000, validation_step - every 1000 steps.
 ## Данные
 Модель обучалась на следующем датасете:
+- **Russian_jokes:**
+  Ссылка: https://huggingface.co/datasets/IgorVolochay/russian_jokes
+  _Пример строки:_ "- Зять, а ты знаешь, где найти того мужчину, который спас меня, когда я тонула?- Да, он уже приходил ко мне извиняться!"
+ Во время обучения выборка была поделена на train и test соответственно: 135497 строк и 15056 строк.
+## Оценка качества (Quality Report)
+Для оценки качества была использована метрика perplexity:
+(Лучшее минимальное значение)
+- **Perplexity 'nano':** 4.250
+- **Perplexity 'mini':** 4.193
+- **Perplexity 'small':** 4.184
 ## Примеры генерации