badaoui
/

optimum-neuron_compile-cache

Model card Files Files and versions Community

Synchronizing local compiler cache of HuggingFaceTB/SmolLM2-135M-Instruct

#10

by badaoui HF Staff - opened 10 days ago

base: refs/heads/main

←

from: refs/pr/10

Discussion Files changed

+42650

-1

Files changed (22) hide show

.gitattributes +5 -0
neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.0/bert/hfl/chinese-roberta-wwm-ext/67f268f13d78dbbccbec.json +57 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/compile_flags.json +1 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.done +0 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.hlo_module.pb +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.neff +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_422b8589ac007d38a4db/model.neuron +1 -1
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/config.json +61 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/model.neuron +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/special_tokens_map.json +37 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/tokenizer.json +0 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/tokenizer_config.json +56 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/vocab.txt +0 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/compile_flags.json +1 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.done +0 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.hlo_module.pb +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.neff +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/compile_flags.json +1 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.done +0 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.hlo_module.pb +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.neff +3 -0
neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/wrapped_neff.hlo +3 -0

.gitattributes CHANGED Viewed

@@ -64,3 +64,8 @@ neuronxcc-2.19.8089.0+8ab9f450/MODULE_bbfac8bf25e0db852ad6+431f5505/model.neff f
 neuronxcc-2.19.8089.0+8ab9f450/MODULE_c6adfb0a32e0702731a6+a9d440f5/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.19.8089.0+8ab9f450/MODULE_c6adfb0a32e0702731a6+a9d440f5/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.19.8089.0+8ab9f450/MODULE_422b8589ac007d38a4db/model.neuron filter=lfs diff=lfs merge=lfs -text

 neuronxcc-2.19.8089.0+8ab9f450/MODULE_c6adfb0a32e0702731a6+a9d440f5/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.19.8089.0+8ab9f450/MODULE_c6adfb0a32e0702731a6+a9d440f5/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.19.8089.0+8ab9f450/MODULE_422b8589ac007d38a4db/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/model.neuron filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text

neuronxcc-2.19.8089.0+8ab9f450/0_REGISTRY/0.3.0/bert/hfl/chinese-roberta-wwm-ext/67f268f13d78dbbccbec.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hfl/chinese-roberta-wwm-ext",
+  "_task": "fill-mask",
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 21128
+}

neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "-O2", "--lnc=1", "--logfile=/tmp/nxd_model/context_encoding_model/_tp0_bk0/log-neuron-cc.txt"]

neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.done ADDED Viewed

File without changes

neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:88cdcf922345d6e217638a13685b97154fd80d4f11e100392403306c7a09fe40
+size 573342

neuronxcc-2.19.8089.0+8ab9f450/MODULE_12f25f9edee472c92073+ed72d204/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:278a85381fd52dc501c0f2d34ad0ab1cbba2531317782947bfe19c00ca5b4bc4
+size 502784

neuronxcc-2.19.8089.0+8ab9f450/MODULE_422b8589ac007d38a4db/model.neuron CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a7da8f0b854060660988260ce71f6aa89f6633c9146a96a2cc948ac489d0fed3
 size 341539130

 version https://git-lfs.github.com/spec/v1
+oid sha256:b26a0d1127f72f52a36e3eab06b527bea82b2705bcee57ac8f7838fc56ddf5fe
 size 341539130

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "BertForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "neuron": {
+    "auto_cast": null,
+    "auto_cast_type": null,
+    "compiler_type": "neuronx-cc",
+    "compiler_version": "2.19.8089.0+8ab9f450",
+    "disable_fallback": false,
+    "disable_fast_relayout": false,
+    "dynamic_batch_size": false,
+    "inline_weights_to_neff": true,
+    "input_names": [
+      "input_ids",
+      "attention_mask",
+      "token_type_ids"
+    ],
+    "model_type": "bert",
+    "optlevel": "2",
+    "output_attentions": false,
+    "output_hidden_states": false,
+    "output_names": [
+      "logits"
+    ],
+    "static_batch_size": 1,
+    "static_sequence_length": 128,
+    "task": "fill-mask",
+    "tensor_parallel_size": 1
+  },
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "torchscript": true,
+  "transformers_version": "4.51.3",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 21128
+}

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/model.neuron ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ead9a66325e9abe86bed1c6ff90aa172022bf02851c84f42b481ddc79e9cc22a
+size 441307571

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

neuronxcc-2.19.8089.0+8ab9f450/MODULE_67f268f13d78dbbccbec/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ "--model-type=transformer -O1 --lnc=1 --internal-hlo2tensorizer-options=--experimental-unsafe-fp8e4m3fn-as-fp8e4m3 --logfile=/tmp/nxd_model/layout_opt/log-neuron-cc.txt"

neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.done ADDED Viewed

File without changes

neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:686d2742fc308144f2a055bfff7e3e94f1ae06d33d941792cc011af8d9af5981
+size 97422

neuronxcc-2.19.8089.0+8ab9f450/MODULE_a521372e1f6ddff8e709+431f5505/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bffa50ee70a6c02efb61abecdbc202a59b9bd1a36a9b31db3ab0b86ebb2be211
+size 154624

neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--auto-cast=none", "--model-type=transformer", "--tensorizer-options=--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2 --vectorize-strided-dma ", "-O2", "--lnc=1", "--logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt", "--enable-internal-neff-wrapper"]

neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.done ADDED Viewed

File without changes

neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6f708b99f5f21d5565d385010c1a7c31895fde634eaae2b124fc478a539404a9
+size 618980

neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c4bad92e91276646e987243503f630dba41b9070e921f33caabddb5c5f1b299
+size 625664

neuronxcc-2.19.8089.0+8ab9f450/MODULE_b76ed924291f303a724f+a9d440f5/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3aa7d1915ae23756f6896383d8d079cc9a07a60134db6c2abb937836d99d157b
+size 726873