Update README.md (#1)
Browse files- Update README.md (e522cbe6a96bc3354e4bf9d7feced6ea1c7cfcdd)
Co-authored-by: manjuan <[email protected]>
README.md
CHANGED
@@ -16,9 +16,11 @@ datasets:
|
|
16 |
|
17 |
## 测试结果
|
18 |
|
|
|
|
|
19 |
我们利用 RWKV Runner 提供的接口对数据集进行批量测试。测试采用零样本(0-shot)方式,每条数据独立输入模型进行推理。
|
20 |
|
21 |
-
测试结果表明,模型整体正确率超过 99.
|
22 |
|
23 |
|文件名 |测试数据条数|正确条数|正确率 (%)|
|
24 |
|----------------|-----------|--------|----------|
|
@@ -36,7 +38,8 @@ datasets:
|
|
36 |
|ADD_test |499 | 497 | 99.60%|
|
37 |
|ADD_test_hard |463 | 457 | 98.70%|
|
38 |
|ADD_random_test |1000 | 997 | 99.70%|
|
39 |
-
|
|
|
40 |
|
41 |
详细的测试实现可参考 [RWKV-7-Arithmetic](https://huggingface.co/datasets/shoumenchougou/RWKV-7-Arithmetic) 数据集中的 `Test.ipynb` 测试脚本。
|
42 |
|
|
|
16 |
|
17 |
## 测试结果
|
18 |
|
19 |
+
> 2025 年 7 月 24 日新增:添加了 3M 的科学计数法数据进行训练,然后测试了 440 条科学计数法数据,该类数据正确率达到 94.55%。
|
20 |
+
|
21 |
我们利用 RWKV Runner 提供的接口对数据集进行批量测试。测试采用零样本(0-shot)方式,每条数据独立输入模型进行推理。
|
22 |
|
23 |
+
测试结果表明,模型整体正确率超过 99.2%,大部分测试文档达到 100% 准确率,即使表现最差的文档正确率也超过 ~~97%~~ 94.5%。
|
24 |
|
25 |
|文件名 |测试数据条数|正确条数|正确率 (%)|
|
26 |
|----------------|-----------|--------|----------|
|
|
|
38 |
|ADD_test |499 | 497 | 99.60%|
|
39 |
|ADD_test_hard |463 | 457 | 98.70%|
|
40 |
|ADD_random_test |1000 | 997 | 99.70%|
|
41 |
+
|Test_sci.jsonl |440 | 416 | 94.55%|
|
42 |
+
|全部文件 |7131 | 7075 | 99.21%|
|
43 |
|
44 |
详细的测试实现可参考 [RWKV-7-Arithmetic](https://huggingface.co/datasets/shoumenchougou/RWKV-7-Arithmetic) 数据集中的 `Test.ipynb` 测试脚本。
|
45 |
|