kurogane's picture
Update README.md
3933953 verified
---
base_model:
- sbintuitions/sarashina2.2-3b-instruct-v0.1
library_name: transformers
license: mit
language:
- en
datasets:
- nvidia/OpenMathReasoning
tags:
- math
---
[nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。
トレーニングは以下のコードを使用しています。
[unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py)
ちなみにAIME 2024は0%でした。
元モデルよりむしろ弱体化していました(泣
![accuracy_comparison.png](accuracy_comparison.png)