|
--- |
|
base_model: |
|
- sbintuitions/sarashina2.2-3b-instruct-v0.1 |
|
library_name: transformers |
|
license: mit |
|
language: |
|
- en |
|
datasets: |
|
- nvidia/OpenMathReasoning |
|
tags: |
|
- math |
|
--- |
|
|
|
[nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。 |
|
|
|
トレーニングは以下のコードを使用しています。 |
|
[unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py) |
|
|
|
ちなみにAIME 2024は0%でした。 |
|
元モデルよりむしろ弱体化していました(泣 |
|
 |