Safetensors
qwen2
stardust-eques commited on
Commit
8ca6283
·
verified ·
1 Parent(s): d1d0465

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +9 -0
README.md CHANGED
@@ -11,6 +11,14 @@ datasets:
11
  [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
12
  に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
13
 
 
 
 
 
 
 
 
 
14
 
15
  | Model | Base model | Dataset | Size | Organization |
16
  | ---- | ---- | ---- | ---- | ---- |
@@ -136,4 +144,5 @@ Apache-2.0
136
  - SakanaAI & Swallow team : development and release of TinySwallow-1.5B
137
  - BespokeLabs : development and share of training codes
138
  - NovaSkyAI : development and share of SkyThought
 
139
 
 
11
  [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
12
  に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
13
 
14
+ ## TinySwallowとは
15
+ SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。
16
+
17
+
18
+ ## Stratos-35kとは
19
+ Bespoke Labsにより公開されている質問、推論の過程、そして答えからなる推論データセットです。
20
+ 話題の[Deepseek-R1](https://github.com/deepseek-ai/DeepSeek-R1)を用いて合成されました。
21
+
22
 
23
  | Model | Base model | Dataset | Size | Organization |
24
  | ---- | ---- | ---- | ---- | ---- |
 
144
  - SakanaAI & Swallow team : development and release of TinySwallow-1.5B
145
  - BespokeLabs : development and share of training codes
146
  - NovaSkyAI : development and share of SkyThought
147
+ - Authors of LlamaFactory
148