pigeon01 commited on Jun 3, 2023

Commit

7a40ce8

1 Parent(s): 7cedf03

Training in progress, epoch 1

Browse files

Files changed (22) hide show

.gitignore +1 -0
config.json +35 -0
pytorch_model.bin +3 -0
runs/Jun03_07-02-48_bd31fece64bd/1685776171.3980927/events.out.tfevents.1685776171.bd31fece64bd.168.1 +3 -0
runs/Jun03_07-02-48_bd31fece64bd/events.out.tfevents.1685776162.bd31fece64bd.168.0 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/1685776250.5779/events.out.tfevents.1685776250.bd31fece64bd.168.3 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/1685776332.75175/events.out.tfevents.1685776332.bd31fece64bd.168.5 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/1685776406.9812376/events.out.tfevents.1685776406.bd31fece64bd.168.7 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776250.bd31fece64bd.168.2 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776332.bd31fece64bd.168.4 +3 -0
runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776406.bd31fece64bd.168.6 +3 -0
runs/Jun03_07-14-05_bd31fece64bd/1685776451.1795483/events.out.tfevents.1685776451.bd31fece64bd.168.9 +3 -0
runs/Jun03_07-14-05_bd31fece64bd/events.out.tfevents.1685776451.bd31fece64bd.168.8 +3 -0
runs/Jun03_07-19-26_bd31fece64bd/1685776773.1338637/events.out.tfevents.1685776773.bd31fece64bd.168.11 +3 -0
runs/Jun03_07-19-26_bd31fece64bd/events.out.tfevents.1685776773.bd31fece64bd.168.10 +3 -0
runs/Jun03_07-53-11_bd31fece64bd/1685781045.8641338/events.out.tfevents.1685781045.bd31fece64bd.168.13 +3 -0
runs/Jun03_07-53-11_bd31fece64bd/events.out.tfevents.1685781033.bd31fece64bd.168.12 +3 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +109 -0
tokenizer_config.json +119 -0
training_args.bin +3 -0
vocab.json +0 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "alirezamsh/small100",
+  "activation_dropout": 0.0,
+  "activation_function": "relu",
+  "architectures": [
+    "M2M100ForConditionalGeneration"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 0,
+  "d_model": 1024,
+  "decoder_attention_heads": 16,
+  "decoder_ffn_dim": 4096,
+  "decoder_layerdrop": 0.0,
+  "decoder_layers": 3,
+  "decoder_start_token_id": 2,
+  "dropout": 0.1,
+  "encoder_attention_heads": 16,
+  "encoder_ffn_dim": 4096,
+  "encoder_layerdrop": 0.0,
+  "encoder_layers": 12,
+  "eos_token_id": 2,
+  "init_std": 0.02,
+  "is_encoder_decoder": true,
+  "max_length": 256,
+  "max_position_embeddings": 1024,
+  "model_type": "m2m_100",
+  "num_beams": 5,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "scale_embedding": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.29.2",
+  "use_cache": true,
+  "vocab_size": 128112
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20c9d5f14af212b4b729a75d60c15b01757fb62b64620bd718f68c74e1e9e790
+size 1339441057

runs/Jun03_07-02-48_bd31fece64bd/1685776171.3980927/events.out.tfevents.1685776171.bd31fece64bd.168.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa46f8034deec10191397cd70c57640659acc42fa29f628cd132f667af3822d8
+size 6237

runs/Jun03_07-02-48_bd31fece64bd/events.out.tfevents.1685776162.bd31fece64bd.168.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9efc0199d98776ba708343d4c5c0071582566e75a2181d391e68d67faf7db748
+size 4714

runs/Jun03_07-10-44_bd31fece64bd/1685776250.5779/events.out.tfevents.1685776250.bd31fece64bd.168.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8542b1cbbe28f3bdefeea37b5b52fb746551953f4594af7afc800e461e052362
+size 6237

runs/Jun03_07-10-44_bd31fece64bd/1685776332.75175/events.out.tfevents.1685776332.bd31fece64bd.168.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0acb7a85922766874b33b3b2424f762c1063fd3112bac1651b551c3e6ac017d5
+size 6237

runs/Jun03_07-10-44_bd31fece64bd/1685776406.9812376/events.out.tfevents.1685776406.bd31fece64bd.168.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:367590fa945532b7ceefd372b6594fb6b80c155b747a14dcd2c786ebdfcf422c
+size 6237

runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776250.bd31fece64bd.168.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:163b7faa6fba31337ba54a2c391263ba9eb81796c03852bc1c8d76d6eb8fc0d6
+size 4460

runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776332.bd31fece64bd.168.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:821aafba9ad442daaeb3dbc566d92fa802a8685b17562d79b60d895c7508638d
+size 4460

runs/Jun03_07-10-44_bd31fece64bd/events.out.tfevents.1685776406.bd31fece64bd.168.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c8de8fc09e331e6a865437c5b1b95dc733f0c243d3e9548b69bb8c4676cc1c1
+size 4460

runs/Jun03_07-14-05_bd31fece64bd/1685776451.1795483/events.out.tfevents.1685776451.bd31fece64bd.168.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bc709562a2cfe2af8d07ebc41d05a4171211b72df30841cdf1909e9278ce0c79
+size 6237

runs/Jun03_07-14-05_bd31fece64bd/events.out.tfevents.1685776451.bd31fece64bd.168.8 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b3c875b4ed2e07c2cabd9b21af49af5aa566780e4c55a88e2e9f31d5da68d098
+size 4459

runs/Jun03_07-19-26_bd31fece64bd/1685776773.1338637/events.out.tfevents.1685776773.bd31fece64bd.168.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f6c631af59e6973085d43a61a48d59fcee801eeb8b9b38b9f1e20186395a554
+size 6237

runs/Jun03_07-19-26_bd31fece64bd/events.out.tfevents.1685776773.bd31fece64bd.168.10 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1da7941155ae604baacd3c41bebb8aa4e8621be1b5263f7b05d1bebe6e638835
+size 4458

runs/Jun03_07-53-11_bd31fece64bd/1685781045.8641338/events.out.tfevents.1685781045.bd31fece64bd.168.13 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5d67720185cae00d6465154585702b7ecd77e603888fb48d1b4c9fb288cc819d
+size 6237

runs/Jun03_07-53-11_bd31fece64bd/events.out.tfevents.1685781033.bd31fece64bd.168.12 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:624504b56e1ece538071cb8c90588a64c926811ed3f6ef63de3b0587ed846a4f
+size 7510

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d8f7c76ed2a5e0822be39f0a4f95a55eb19c78f4593ce609e2edbc2aea4d380a
+size 2423393

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,109 @@

+{
+  "additional_special_tokens": [
+    "__af__",
+    "__am__",
+    "__ar__",
+    "__ast__",
+    "__az__",
+    "__ba__",
+    "__be__",
+    "__bg__",
+    "__bn__",
+    "__br__",
+    "__bs__",
+    "__ca__",
+    "__ceb__",
+    "__cs__",
+    "__cy__",
+    "__da__",
+    "__de__",
+    "__el__",
+    "__en__",
+    "__es__",
+    "__et__",
+    "__fa__",
+    "__ff__",
+    "__fi__",
+    "__fr__",
+    "__fy__",
+    "__ga__",
+    "__gd__",
+    "__gl__",
+    "__gu__",
+    "__ha__",
+    "__he__",
+    "__hi__",
+    "__hr__",
+    "__ht__",
+    "__hu__",
+    "__hy__",
+    "__id__",
+    "__ig__",
+    "__ilo__",
+    "__is__",
+    "__it__",
+    "__ja__",
+    "__jv__",
+    "__ka__",
+    "__kk__",
+    "__km__",
+    "__kn__",
+    "__ko__",
+    "__lb__",
+    "__lg__",
+    "__ln__",
+    "__lo__",
+    "__lt__",
+    "__lv__",
+    "__mg__",
+    "__mk__",
+    "__ml__",
+    "__mn__",
+    "__mr__",
+    "__ms__",
+    "__my__",
+    "__ne__",
+    "__nl__",
+    "__no__",
+    "__ns__",
+    "__oc__",
+    "__or__",
+    "__pa__",
+    "__pl__",
+    "__ps__",
+    "__pt__",
+    "__ro__",
+    "__ru__",
+    "__sd__",
+    "__si__",
+    "__sk__",
+    "__sl__",
+    "__so__",
+    "__sq__",
+    "__sr__",
+    "__ss__",
+    "__su__",
+    "__sv__",
+    "__sw__",
+    "__ta__",
+    "__th__",
+    "__tl__",
+    "__tn__",
+    "__tr__",
+    "__uk__",
+    "__ur__",
+    "__uz__",
+    "__vi__",
+    "__wo__",
+    "__xh__",
+    "__yi__",
+    "__yo__",
+    "__zh__",
+    "__zu__"
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,119 @@

+{
+  "additional_special_tokens": [
+    "__af__",
+    "__am__",
+    "__ar__",
+    "__ast__",
+    "__az__",
+    "__ba__",
+    "__be__",
+    "__bg__",
+    "__bn__",
+    "__br__",
+    "__bs__",
+    "__ca__",
+    "__ceb__",
+    "__cs__",
+    "__cy__",
+    "__da__",
+    "__de__",
+    "__el__",
+    "__en__",
+    "__es__",
+    "__et__",
+    "__fa__",
+    "__ff__",
+    "__fi__",
+    "__fr__",
+    "__fy__",
+    "__ga__",
+    "__gd__",
+    "__gl__",
+    "__gu__",
+    "__ha__",
+    "__he__",
+    "__hi__",
+    "__hr__",
+    "__ht__",
+    "__hu__",
+    "__hy__",
+    "__id__",
+    "__ig__",
+    "__ilo__",
+    "__is__",
+    "__it__",
+    "__ja__",
+    "__jv__",
+    "__ka__",
+    "__kk__",
+    "__km__",
+    "__kn__",
+    "__ko__",
+    "__lb__",
+    "__lg__",
+    "__ln__",
+    "__lo__",
+    "__lt__",
+    "__lv__",
+    "__mg__",
+    "__mk__",
+    "__ml__",
+    "__mn__",
+    "__mr__",
+    "__ms__",
+    "__my__",
+    "__ne__",
+    "__nl__",
+    "__no__",
+    "__ns__",
+    "__oc__",
+    "__or__",
+    "__pa__",
+    "__pl__",
+    "__ps__",
+    "__pt__",
+    "__ro__",
+    "__ru__",
+    "__sd__",
+    "__si__",
+    "__sk__",
+    "__sl__",
+    "__so__",
+    "__sq__",
+    "__sr__",
+    "__ss__",
+    "__su__",
+    "__sv__",
+    "__sw__",
+    "__ta__",
+    "__th__",
+    "__tl__",
+    "__tn__",
+    "__tr__",
+    "__uk__",
+    "__ur__",
+    "__uz__",
+    "__vi__",
+    "__wo__",
+    "__xh__",
+    "__yi__",
+    "__yo__",
+    "__zh__",
+    "__zu__"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "</s>",
+  "language_codes": "m2m100",
+  "model_max_length": 1024,
+  "num_madeup_words": 8,
+  "pad_token": "<pad>",
+  "return_tensors": "pt",
+  "sep_token": "</s>",
+  "sp_model_kwargs": {},
+  "src_lang": "ko",
+  "tgt_lang": "en",
+  "tokenizer_class": "M2M100Tokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dd8f3b16d4f001a35e5e469cfc96e401e3a1dca61999dbfbe9752dccbc0bd362
+size 4091

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff