---
base_model:
  - sbintuitions/sarashina2.2-3b-instruct-v0.1
library_name: transformers
license: mit
language:
- en
datasets:
- nvidia/OpenMathReasoning
tags:
- math
---

[nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。

トレーニングは以下のコードを使用しています。
[unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py)

ちなみにAIME 2024は0%でした。
元モデルよりむしろ弱体化していました(泣
![accuracy_comparison.png](accuracy_comparison.png)