shoumenchougou Ehoon commited on
Commit
7aae0c3
·
verified ·
1 Parent(s): cd6ec6d

Update README.md (#1)

Browse files

- Update README.md (e522cbe6a96bc3354e4bf9d7feced6ea1c7cfcdd)


Co-authored-by: manjuan <[email protected]>

Files changed (1) hide show
  1. README.md +5 -2
README.md CHANGED
@@ -16,9 +16,11 @@ datasets:
16
 
17
  ## 测试结果
18
 
 
 
19
  我们利用 RWKV Runner 提供的接口对数据集进行批量测试。测试采用零样本(0-shot)方式,每条数据独立输入模型进行推理。
20
 
21
- 测试结果表明,模型整体正确率超过 99.5%,大部分测试文档达到 100% 准确率,即使表现最差的文档正确率也超过 97%。
22
 
23
  |文件名 |测试数据条数|正确条数|正确率 (%)|
24
  |----------------|-----------|--------|----------|
@@ -36,7 +38,8 @@ datasets:
36
  |ADD_test |499 | 497 | 99.60%|
37
  |ADD_test_hard |463 | 457 | 98.70%|
38
  |ADD_random_test |1000 | 997 | 99.70%|
39
- |全部文件 |6691 | 6659 | 99.52%|
 
40
 
41
  详细的测试实现可参考 [RWKV-7-Arithmetic](https://huggingface.co/datasets/shoumenchougou/RWKV-7-Arithmetic) 数据集中的 `Test.ipynb` 测试脚本。
42
 
 
16
 
17
  ## 测试结果
18
 
19
+ > 2025 年 7 月 24 日新增:添加了 3M 的科学计数法数据进行训练,然后测试了 440 条科学计数法数据,该类数据正确率达到 94.55%。
20
+
21
  我们利用 RWKV Runner 提供的接口对数据集进行批量测试。测试采用零样本(0-shot)方式,每条数据独立输入模型进行推理。
22
 
23
+ 测试结果表明,模型整体正确率超过 99.2%,大部分测试文档达到 100% 准确率,即使表现最差的文档正确率也超过 ~~97%~~ 94.5%。
24
 
25
  |文件名 |测试数据条数|正确条数|正确率 (%)|
26
  |----------------|-----------|--------|----------|
 
38
  |ADD_test |499 | 497 | 99.60%|
39
  |ADD_test_hard |463 | 457 | 98.70%|
40
  |ADD_random_test |1000 | 997 | 99.70%|
41
+ |Test_sci.jsonl |440 | 416 | 94.55%|
42
+ |全部文件 |7131 | 7075 | 99.21%|
43
 
44
  详细的测试实现可参考 [RWKV-7-Arithmetic](https://huggingface.co/datasets/shoumenchougou/RWKV-7-Arithmetic) 数据集中的 `Test.ipynb` 测试脚本。
45