Le Vu Loi commited on
Commit
8a91069
·
1 Parent(s): 8c38300

add necessary assets

Browse files
.gitattributes CHANGED
@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ spm.model filter=lfs diff=lfs merge=lfs -text
37
+ nmt_nfkc_vidiacritic.tsv filter=lfs diff=lfs merge=lfs -text
added_tokens.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "</s>": 2,
3
+ "<cls>": 5,
4
+ "<mask>": 4,
5
+ "<pad>": 3,
6
+ "<s>": 1,
7
+ "<sep>": 6,
8
+ "<unk>": 0
9
+ }
nmt_nfkc_vidiacritic.tsv ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6061a3e36047e7e731212812d1ba198ad4d01bf183ed68ae6b052831de9e5713
3
+ size 8560902
required_chars.txt ADDED
@@ -0,0 +1,228 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ 1
3
+ 2
4
+ 3
5
+ 4
6
+ 5
7
+ 6
8
+ 7
9
+ 8
10
+ 9
11
+ !
12
+ "
13
+ #
14
+ $
15
+ %
16
+ &
17
+ '
18
+ (
19
+ )
20
+ *
21
+ +
22
+ ,
23
+ -
24
+ .
25
+ /
26
+ :
27
+ ;
28
+ <
29
+ =
30
+ >
31
+ ?
32
+ @
33
+ [
34
+ \
35
+ ]
36
+ ^
37
+ _
38
+ `
39
+ {
40
+ |
41
+ }
42
+ ~
43
+ a
44
+ á
45
+
46
+ à
47
+
48
+ ã
49
+ ă
50
+
51
+
52
+
53
+
54
+
55
+ â
56
+
57
+
58
+
59
+
60
+
61
+ e
62
+ é
63
+
64
+ è
65
+
66
+
67
+ ê
68
+ ế
69
+
70
+
71
+
72
+
73
+ i
74
+ í
75
+
76
+ ì
77
+
78
+ ĩ
79
+ o
80
+ ó
81
+
82
+ ò
83
+
84
+ õ
85
+ ô
86
+
87
+
88
+
89
+
90
+
91
+ ơ
92
+
93
+
94
+
95
+
96
+
97
+ u
98
+ ú
99
+
100
+ ù
101
+
102
+ ũ
103
+ ư
104
+
105
+
106
+
107
+
108
+
109
+ y
110
+ ý
111
+
112
+
113
+
114
+
115
+ đ
116
+ A
117
+ Á
118
+
119
+ À
120
+
121
+ Ã
122
+ Ă
123
+
124
+
125
+
126
+
127
+
128
+ Â
129
+
130
+
131
+
132
+
133
+
134
+ E
135
+ É
136
+
137
+ È
138
+
139
+
140
+ Ê
141
+
142
+
143
+
144
+
145
+
146
+ I
147
+ Í
148
+
149
+ Ì
150
+
151
+ Ĩ
152
+ O
153
+ Ó
154
+
155
+ Ò
156
+
157
+ Õ
158
+ Ô
159
+
160
+
161
+
162
+
163
+
164
+ Ơ
165
+
166
+
167
+
168
+
169
+
170
+ U
171
+ Ú
172
+
173
+ Ù
174
+
175
+ Ũ
176
+ Ư
177
+
178
+
179
+
180
+
181
+
182
+ Y
183
+ Ý
184
+
185
+
186
+
187
+
188
+ Đ
189
+ b
190
+ c
191
+ d
192
+ f
193
+ g
194
+ h
195
+ j
196
+ k
197
+ l
198
+ m
199
+ n
200
+ p
201
+ q
202
+ r
203
+ s
204
+ t
205
+ v
206
+ w
207
+ x
208
+ z
209
+ B
210
+ C
211
+ D
212
+ F
213
+ G
214
+ H
215
+ J
216
+ K
217
+ L
218
+ M
219
+ N
220
+ P
221
+ Q
222
+ R
223
+ S
224
+ T
225
+ V
226
+ W
227
+ X
228
+ Z
special_tokens_map.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<s>",
3
+ "cls_token": "<cls>",
4
+ "eos_token": "</s>",
5
+ "mask_token": "<mask>",
6
+ "pad_token": "<pad>",
7
+ "sep_token": "<sep>",
8
+ "unk_token": "<unk>"
9
+ }
spm.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a35352bf88d30f88b94c2a1ec31984181765ea118f51ed3f5bc679bfa5b7de28
3
+ size 1355391
tokenizer_config.json ADDED
@@ -0,0 +1,74 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<unk>",
5
+ "lstrip": false,
6
+ "normalized": true,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<s>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<pad>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "<mask>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ },
43
+ "5": {
44
+ "content": "<cls>",
45
+ "lstrip": false,
46
+ "normalized": false,
47
+ "rstrip": false,
48
+ "single_word": false,
49
+ "special": true
50
+ },
51
+ "6": {
52
+ "content": "<sep>",
53
+ "lstrip": false,
54
+ "normalized": false,
55
+ "rstrip": false,
56
+ "single_word": false,
57
+ "special": true
58
+ }
59
+ },
60
+ "additional_special_tokens": [],
61
+ "bos_token": "<s>",
62
+ "clean_up_tokenization_spaces": true,
63
+ "cls_token": "<cls>",
64
+ "do_lower_case": false,
65
+ "eos_token": "</s>",
66
+ "mask_token": "<mask>",
67
+ "model_max_length": 1000000000000000019884624838656,
68
+ "pad_token": "<pad>",
69
+ "sep_token": "<sep>",
70
+ "sp_model_kwargs": {},
71
+ "split_by_punct": false,
72
+ "tokenizer_class": "DebertaV2Tokenizer",
73
+ "unk_token": "<unk>"
74
+ }
user_defined_symbols.txt ADDED
@@ -0,0 +1,508 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ <s>
2
+ </s>
3
+ <pad>
4
+ <mask>
5
+ <cls>
6
+ <sep>
7
+ <enter>
8
+ <tab>
9
+ [unused000]
10
+ [unused001]
11
+ [unused002]
12
+ [unused003]
13
+ [unused004]
14
+ [unused005]
15
+ [unused006]
16
+ [unused007]
17
+ [unused008]
18
+ [unused009]
19
+ [unused010]
20
+ [unused011]
21
+ [unused012]
22
+ [unused013]
23
+ [unused014]
24
+ [unused015]
25
+ [unused016]
26
+ [unused017]
27
+ [unused018]
28
+ [unused019]
29
+ [unused020]
30
+ [unused021]
31
+ [unused022]
32
+ [unused023]
33
+ [unused024]
34
+ [unused025]
35
+ [unused026]
36
+ [unused027]
37
+ [unused028]
38
+ [unused029]
39
+ [unused030]
40
+ [unused031]
41
+ [unused032]
42
+ [unused033]
43
+ [unused034]
44
+ [unused035]
45
+ [unused036]
46
+ [unused037]
47
+ [unused038]
48
+ [unused039]
49
+ [unused040]
50
+ [unused041]
51
+ [unused042]
52
+ [unused043]
53
+ [unused044]
54
+ [unused045]
55
+ [unused046]
56
+ [unused047]
57
+ [unused048]
58
+ [unused049]
59
+ [unused050]
60
+ [unused051]
61
+ [unused052]
62
+ [unused053]
63
+ [unused054]
64
+ [unused055]
65
+ [unused056]
66
+ [unused057]
67
+ [unused058]
68
+ [unused059]
69
+ [unused060]
70
+ [unused061]
71
+ [unused062]
72
+ [unused063]
73
+ [unused064]
74
+ [unused065]
75
+ [unused066]
76
+ [unused067]
77
+ [unused068]
78
+ [unused069]
79
+ [unused070]
80
+ [unused071]
81
+ [unused072]
82
+ [unused073]
83
+ [unused074]
84
+ [unused075]
85
+ [unused076]
86
+ [unused077]
87
+ [unused078]
88
+ [unused079]
89
+ [unused080]
90
+ [unused081]
91
+ [unused082]
92
+ [unused083]
93
+ [unused084]
94
+ [unused085]
95
+ [unused086]
96
+ [unused087]
97
+ [unused088]
98
+ [unused089]
99
+ [unused090]
100
+ [unused091]
101
+ [unused092]
102
+ [unused093]
103
+ [unused094]
104
+ [unused095]
105
+ [unused096]
106
+ [unused097]
107
+ [unused098]
108
+ [unused099]
109
+ [unused100]
110
+ [unused101]
111
+ [unused102]
112
+ [unused103]
113
+ [unused104]
114
+ [unused105]
115
+ [unused106]
116
+ [unused107]
117
+ [unused108]
118
+ [unused109]
119
+ [unused110]
120
+ [unused111]
121
+ [unused112]
122
+ [unused113]
123
+ [unused114]
124
+ [unused115]
125
+ [unused116]
126
+ [unused117]
127
+ [unused118]
128
+ [unused119]
129
+ [unused120]
130
+ [unused121]
131
+ [unused122]
132
+ [unused123]
133
+ [unused124]
134
+ [unused125]
135
+ [unused126]
136
+ [unused127]
137
+ [unused128]
138
+ [unused129]
139
+ [unused130]
140
+ [unused131]
141
+ [unused132]
142
+ [unused133]
143
+ [unused134]
144
+ [unused135]
145
+ [unused136]
146
+ [unused137]
147
+ [unused138]
148
+ [unused139]
149
+ [unused140]
150
+ [unused141]
151
+ [unused142]
152
+ [unused143]
153
+ [unused144]
154
+ [unused145]
155
+ [unused146]
156
+ [unused147]
157
+ [unused148]
158
+ [unused149]
159
+ [unused150]
160
+ [unused151]
161
+ [unused152]
162
+ [unused153]
163
+ [unused154]
164
+ [unused155]
165
+ [unused156]
166
+ [unused157]
167
+ [unused158]
168
+ [unused159]
169
+ [unused160]
170
+ [unused161]
171
+ [unused162]
172
+ [unused163]
173
+ [unused164]
174
+ [unused165]
175
+ [unused166]
176
+ [unused167]
177
+ [unused168]
178
+ [unused169]
179
+ [unused170]
180
+ [unused171]
181
+ [unused172]
182
+ [unused173]
183
+ [unused174]
184
+ [unused175]
185
+ [unused176]
186
+ [unused177]
187
+ [unused178]
188
+ [unused179]
189
+ [unused180]
190
+ [unused181]
191
+ [unused182]
192
+ [unused183]
193
+ [unused184]
194
+ [unused185]
195
+ [unused186]
196
+ [unused187]
197
+ [unused188]
198
+ [unused189]
199
+ [unused190]
200
+ [unused191]
201
+ [unused192]
202
+ [unused193]
203
+ [unused194]
204
+ [unused195]
205
+ [unused196]
206
+ [unused197]
207
+ [unused198]
208
+ [unused199]
209
+ [unused200]
210
+ [unused201]
211
+ [unused202]
212
+ [unused203]
213
+ [unused204]
214
+ [unused205]
215
+ [unused206]
216
+ [unused207]
217
+ [unused208]
218
+ [unused209]
219
+ [unused210]
220
+ [unused211]
221
+ [unused212]
222
+ [unused213]
223
+ [unused214]
224
+ [unused215]
225
+ [unused216]
226
+ [unused217]
227
+ [unused218]
228
+ [unused219]
229
+ [unused220]
230
+ [unused221]
231
+ [unused222]
232
+ [unused223]
233
+ [unused224]
234
+ [unused225]
235
+ [unused226]
236
+ [unused227]
237
+ [unused228]
238
+ [unused229]
239
+ [unused230]
240
+ [unused231]
241
+ [unused232]
242
+ [unused233]
243
+ [unused234]
244
+ [unused235]
245
+ [unused236]
246
+ [unused237]
247
+ [unused238]
248
+ [unused239]
249
+ [unused240]
250
+ [unused241]
251
+ [unused242]
252
+ [unused243]
253
+ [unused244]
254
+ [unused245]
255
+ [unused246]
256
+ [unused247]
257
+ [unused248]
258
+ [unused249]
259
+ [unused250]
260
+ [unused251]
261
+ [unused252]
262
+ [unused253]
263
+ [unused254]
264
+ [unused255]
265
+ [unused256]
266
+ [unused257]
267
+ [unused258]
268
+ [unused259]
269
+ [unused260]
270
+ [unused261]
271
+ [unused262]
272
+ [unused263]
273
+ [unused264]
274
+ [unused265]
275
+ [unused266]
276
+ [unused267]
277
+ [unused268]
278
+ [unused269]
279
+ [unused270]
280
+ [unused271]
281
+ [unused272]
282
+ [unused273]
283
+ [unused274]
284
+ [unused275]
285
+ [unused276]
286
+ [unused277]
287
+ [unused278]
288
+ [unused279]
289
+ [unused280]
290
+ [unused281]
291
+ [unused282]
292
+ [unused283]
293
+ [unused284]
294
+ [unused285]
295
+ [unused286]
296
+ [unused287]
297
+ [unused288]
298
+ [unused289]
299
+ [unused290]
300
+ [unused291]
301
+ [unused292]
302
+ [unused293]
303
+ [unused294]
304
+ [unused295]
305
+ [unused296]
306
+ [unused297]
307
+ [unused298]
308
+ [unused299]
309
+ [unused300]
310
+ [unused301]
311
+ [unused302]
312
+ [unused303]
313
+ [unused304]
314
+ [unused305]
315
+ [unused306]
316
+ [unused307]
317
+ [unused308]
318
+ [unused309]
319
+ [unused310]
320
+ [unused311]
321
+ [unused312]
322
+ [unused313]
323
+ [unused314]
324
+ [unused315]
325
+ [unused316]
326
+ [unused317]
327
+ [unused318]
328
+ [unused319]
329
+ [unused320]
330
+ [unused321]
331
+ [unused322]
332
+ [unused323]
333
+ [unused324]
334
+ [unused325]
335
+ [unused326]
336
+ [unused327]
337
+ [unused328]
338
+ [unused329]
339
+ [unused330]
340
+ [unused331]
341
+ [unused332]
342
+ [unused333]
343
+ [unused334]
344
+ [unused335]
345
+ [unused336]
346
+ [unused337]
347
+ [unused338]
348
+ [unused339]
349
+ [unused340]
350
+ [unused341]
351
+ [unused342]
352
+ [unused343]
353
+ [unused344]
354
+ [unused345]
355
+ [unused346]
356
+ [unused347]
357
+ [unused348]
358
+ [unused349]
359
+ [unused350]
360
+ [unused351]
361
+ [unused352]
362
+ [unused353]
363
+ [unused354]
364
+ [unused355]
365
+ [unused356]
366
+ [unused357]
367
+ [unused358]
368
+ [unused359]
369
+ [unused360]
370
+ [unused361]
371
+ [unused362]
372
+ [unused363]
373
+ [unused364]
374
+ [unused365]
375
+ [unused366]
376
+ [unused367]
377
+ [unused368]
378
+ [unused369]
379
+ [unused370]
380
+ [unused371]
381
+ [unused372]
382
+ [unused373]
383
+ [unused374]
384
+ [unused375]
385
+ [unused376]
386
+ [unused377]
387
+ [unused378]
388
+ [unused379]
389
+ [unused380]
390
+ [unused381]
391
+ [unused382]
392
+ [unused383]
393
+ [unused384]
394
+ [unused385]
395
+ [unused386]
396
+ [unused387]
397
+ [unused388]
398
+ [unused389]
399
+ [unused390]
400
+ [unused391]
401
+ [unused392]
402
+ [unused393]
403
+ [unused394]
404
+ [unused395]
405
+ [unused396]
406
+ [unused397]
407
+ [unused398]
408
+ [unused399]
409
+ [unused400]
410
+ [unused401]
411
+ [unused402]
412
+ [unused403]
413
+ [unused404]
414
+ [unused405]
415
+ [unused406]
416
+ [unused407]
417
+ [unused408]
418
+ [unused409]
419
+ [unused410]
420
+ [unused411]
421
+ [unused412]
422
+ [unused413]
423
+ [unused414]
424
+ [unused415]
425
+ [unused416]
426
+ [unused417]
427
+ [unused418]
428
+ [unused419]
429
+ [unused420]
430
+ [unused421]
431
+ [unused422]
432
+ [unused423]
433
+ [unused424]
434
+ [unused425]
435
+ [unused426]
436
+ [unused427]
437
+ [unused428]
438
+ [unused429]
439
+ [unused430]
440
+ [unused431]
441
+ [unused432]
442
+ [unused433]
443
+ [unused434]
444
+ [unused435]
445
+ [unused436]
446
+ [unused437]
447
+ [unused438]
448
+ [unused439]
449
+ [unused440]
450
+ [unused441]
451
+ [unused442]
452
+ [unused443]
453
+ [unused444]
454
+ [unused445]
455
+ [unused446]
456
+ [unused447]
457
+ [unused448]
458
+ [unused449]
459
+ [unused450]
460
+ [unused451]
461
+ [unused452]
462
+ [unused453]
463
+ [unused454]
464
+ [unused455]
465
+ [unused456]
466
+ [unused457]
467
+ [unused458]
468
+ [unused459]
469
+ [unused460]
470
+ [unused461]
471
+ [unused462]
472
+ [unused463]
473
+ [unused464]
474
+ [unused465]
475
+ [unused466]
476
+ [unused467]
477
+ [unused468]
478
+ [unused469]
479
+ [unused470]
480
+ [unused471]
481
+ [unused472]
482
+ [unused473]
483
+ [unused474]
484
+ [unused475]
485
+ [unused476]
486
+ [unused477]
487
+ [unused478]
488
+ [unused479]
489
+ [unused480]
490
+ [unused481]
491
+ [unused482]
492
+ [unused483]
493
+ [unused484]
494
+ [unused485]
495
+ [unused486]
496
+ [unused487]
497
+ [unused488]
498
+ [unused489]
499
+ [unused490]
500
+ [unused491]
501
+ [unused492]
502
+ [unused493]
503
+ [unused494]
504
+ [unused495]
505
+ [unused496]
506
+ [unused497]
507
+ [unused498]
508
+ [unused499]