kurogane
/

sarashina2.2-3b-OpenMathReasoning-random-100k

Text Generation

text-generation-inference

Model card Files Files and versions

sarashina2.2-3b-OpenMathReasoning-random-100k / README.md

kurogane's picture

Update README.md

3933953 verified about 2 months ago

|

history blame contribute delete

787 Bytes

	---
	base_model:
	- sbintuitions/sarashina2.2-3b-instruct-v0.1
	library_name: transformers
	license: mit
	language:
	- en
	datasets:
	- nvidia/OpenMathReasoning
	tags:
	- math
	---

	[nvidia/OpenMathReasoning](https://huggingface.co/datasets/nvidia/OpenMathReasoning)から抽出した[kurogane/OpenMathReasoning-random-100k-cot](https://huggingface.co/datasets/kurogane/OpenMathReasoning-random-100k-cot)を用いてfine tuningしました。

	トレーニングは以下のコードを使用しています。
	[unsloth_sarashina22_math.py](https://github.com/kuroganegames/sarashina22_trial_and_error_memo/blob/main/unsloth_sarashina22_math.py)

	ちなみにAIME 2024は0%でした。
	元モデルよりむしろ弱体化していました(泣
	![accuracy_comparison.png](accuracy_comparison.png)