File size: 787 Bytes
ef0447b
929710c
 
 
ef0447b
 
 
 
 
 
9ac114a
ef0447b
 
 
 
 
acc36be
 
3933953
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
---
base_model:
  - sbintuitions/sarashina2.2-3b-instruct-v0.1
library_name: transformers
license: mit
language:
- en
datasets:
- nvidia/OpenMathReasoning
tags:
- math
---

[nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。

トレーニングは以下のコードを使用しています。
[unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py)

ちなみにAIME 2024は0%でした。
元モデルよりむしろ弱体化していました(泣
![accuracy_comparison.png](accuracy_comparison.png)