--- base_model: - sbintuitions/sarashina2.2-3b-instruct-v0.1 library_name: transformers license: mit language: - en datasets: - nvidia/OpenMathReasoning tags: - math --- [nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。 トレーニングは以下のコードを使用しています。 [unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py) ちなみにAIME 2024は0%でした。 元モデルよりむしろ弱体化していました(泣 ![accuracy_comparison.png](accuracy_comparison.png)