Upload folder using huggingface_hub

Browse files

Files changed (13) hide show

README.md +103 -0
config.json +40 -0
generation_config.json +7 -0
openvino_config.json +28 -0
openvino_detokenizer.bin +3 -0
openvino_detokenizer.xml +335 -0
openvino_model.bin +3 -0
openvino_model.xml +0 -0
openvino_tokenizer.bin +3 -0
openvino_tokenizer.xml +648 -0
special_tokens_map.json +23 -0
tokenizer.json +0 -0
tokenizer_config.json +19 -0

README.md ADDED Viewed

	@@ -0,0 +1,103 @@

+# Jais-13B OpenVINO INT4
+This repository contains the [inceptionai/jais-13b](https://huggingface.co/inceptionai/jais-13b) model optimized for inference with Intel's OpenVINO runtime. The model has been quantized to INT4 using the AWQ quantization scheme for improved performance while maintaining quality.
+## Model Details
+* **Original Model**: [inceptionai/jais-13b](https://huggingface.co/inceptionai/jais-13b)
+* **Model Type**: Bilingual (Arabic-English) Large Language Model
+* **Parameters**: 13B
+* **OpenVINO Version**: 2024.0+
+* **Quantization**: INT4 Symmetric AWQ (Activation-aware Weight Quantization)
+* **Group Size**: -1 (per-channel quantization)
+Jais-13B is a bilingual model that supports both Arabic and English text generation. The model can:
+- Generate fluent text in both Arabic and English
+- Respond to prompts in either language
+- Handle code-switching between the two languages
+## Optimization Details
+This model was converted from the original Hugging Face model to OpenVINO format using the Optimum Intel library. The following optimization command was used:
+```bash
+optimum-cli export openvino \
+  -m inceptionai/jais-13b \
+  --weight-format int4 \
+  --sym \
+  --dataset auto \
+  --awq \
+  --group-size -1 \
+  --trust-remote-code \
+  jais-13b-int4-sym-ov
+```
+### Optimization Parameters:
+- **INT4 Quantization**: Weights compressed to 4-bit integers
+- **Symmetric Quantization**: Using symmetric quantization for better accuracy
+- **AWQ**: Activation-aware Weight Quantization to preserve model quality
+- **Auto Dataset**: Used automatic dataset sampling for calibration
+- **Group Size**: -1 (quantize each output channel independently)
+- **Trust Remote Code**: Enabled to support custom model code
+## Usage
+### Prerequisites
+- OpenVINO 2024.0 or newer
+- optimum-intel
+- transformers
+### Sample Inference code with Optimum Intel
+```python
+from optimum.intel import OVModelForCausalLM
+from transformers import AutoTokenizer
+# Load tokenizer and model
+model_id = "rpanchum/jais-13b-int4-sym-ov"
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = OVModelForCausalLM.from_pretrained(model_id)
+# Generate text
+prompt = "Write a short story about a robot learning to paint:"
+input_ids = tokenizer(prompt, return_tensors="pt")
+output = model.generate(
+    **input_ids,
+    max_new_tokens=512,
+    temperature=0.7,
+    top_p=0.9,
+)
+response = tokenizer.decode(output[0], skip_special_tokens=True)
+print(response)
+```
+### Alternative: Using OpenVINO GenAI
+1. Install packages required for using OpenVINO GenAI.
+```bash
+pip install openvino-genai huggingface_hub
+```
+2. Download model and run inference.
+```python
+import huggingface_hub as hf_hub
+model_id = "rpanchum/jais-13b-int4-sym-ov"
+model_path = "jais-13b-int4-sym-ov"
+hf_hub.snapshot_download(model_id, local_dir=model_path)
+import openvino_genai as ov_genai
+device = "CPU"
+pipe = ov_genai.LLMPipeline(model_path, device)
+print(pipe.generate("ما هو الذكاء الاصطناعي؟", max_length=200))  # "What is AI?" in Arabic
+print(pipe.generate("What is artificial intelligence?", max_length=200))
+```
+## License
+This model inherits the license of the original [inceptionai/jais-13b](https://huggingface.co/inceptionai/jais-13b) model.

config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "inceptionai/jais-13b",
+  "activation_function": "swiglu",
+  "architectures": [
+    "JAISLMHeadModel"
+  ],
+  "attn_pdrop": 0.0,
+  "auto_map": {
+    "AutoConfig": "inceptionai/jais-13b--configuration_jais.JAISConfig",
+    "AutoModel": "inceptionai/jais-13b--modeling_jais.JAISModel",
+    "AutoModelForCausalLM": "inceptionai/jais-13b--modeling_jais.JAISLMHeadModel",
+    "AutoModelForQuestionAnswering": "inceptionai/jais-13b--modeling_jais.JAISForQuestionAnswering",
+    "AutoModelForSequenceClassification": "inceptionai/jais-13b--modeling_jais.JAISForSequenceClassification",
+    "AutoModelForTokenClassification": "inceptionai/jais-13b--modeling_jais.JAISForTokenClassification"
+  },
+  "bos_token_id": 0,
+  "embd_pdrop": 0.0,
+  "embeddings_scale": 14.6,
+  "eos_token_id": 0,
+  "initializer_range": 0.02,
+  "layer_norm_epsilon": 1e-05,
+  "model_type": "jais",
+  "n_embd": 5120,
+  "n_head": 40,
+  "n_inner": 13653,
+  "n_layer": 40,
+  "n_positions": 2048,
+  "pad_token_id": 0,
+  "position_embedding_type": "alibi",
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.0,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "scale_qk_dot_by_d": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.3",
+  "use_cache": true,
+  "vocab_size": 84992,
+  "width_scale": 0.11100000000000002
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "eos_token_id": 0,
+  "pad_token_id": 0,
+  "transformers_version": "4.48.3"
+}

openvino_config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "compression": null,
+  "dtype": "int4",
+  "input_info": null,
+  "optimum_version": "1.24.0",
+  "quantization_config": {
+    "all_layers": null,
+    "backup_precision": null,
+    "bits": 4,
+    "dataset": "auto",
+    "gptq": null,
+    "group_size": -1,
+    "ignored_scope": null,
+    "lora_correction": null,
+    "num_samples": null,
+    "processor": null,
+    "quant_method": "awq",
+    "ratio": 1.0,
+    "scale_estimation": null,
+    "sensitivity_metric": null,
+    "sym": true,
+    "tokenizer": null,
+    "trust_remote_code": true,
+    "weight_format": "int4"
+  },
+  "save_onnx_model": false,
+  "transformers_version": "4.48.3"
+}

openvino_detokenizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01dd38c159cba9b1a2ad588bddce13bdc30b746e6b9e77ca8f0a03de824e8575
+size 1068648

openvino_detokenizer.xml ADDED Viewed

	@@ -0,0 +1,335 @@

+<?xml version="1.0"?>
+<net name="detokenizer" version="11">
+	<layers>
+		<layer id="0" name="Parameter_1440876" type="Parameter" version="opset1">
+			<data shape="?,?" element_type="i64" />
+			<output>
+				<port id="0" precision="I64" names="Parameter_1440876">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="Convert_1440897" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="2" name="Constant_1440855" type="Const" version="opset1">
+			<data element_type="u8" shape="1068575" offset="0" size="1068575" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>1068575</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="3" name="StringTensorUnpack_1440856" type="StringTensorUnpack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="U8">
+					<dim>1068575</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="Constant_1440880" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="1068575" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="5" name="Constant_1440878" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="1068575" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="6" name="Constant_1440877" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="1068579" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="7" name="Constant_1440879" type="Const" version="opset1">
+			<data element_type="i32" shape="1" offset="1068583" size="4" />
+			<output>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="8" name="Constant_1440882" type="Const" version="opset1">
+			<data element_type="i64" shape="1" offset="1068587" size="8" />
+			<output>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="Slice_1440881" type="Slice" version="opset8">
+			<input>
+				<port id="0" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>1</dim>
+				</port>
+				<port id="4" precision="I64">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="10" name="VocabDecoder_1440883" type="VocabDecoder" version="extension">
+			<data skip_tokens="" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="I32">
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="11" name="FuzeRagged_1440884" type="FuzeRagged" version="extension">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="4" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="12" name="UTF8Validate_1440885" type="UTF8Validate" version="extension">
+			<data replace_mode="true" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="13" name="Constant_1440887" type="Const" version="opset1">
+			<data element_type="u8" shape="51" offset="1068595" size="51" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>51</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="14" name="Constant_1440889" type="Const" version="opset1">
+			<data element_type="u8" shape="2" offset="1068646" size="2" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>2</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="15" name="RegexNormalization_1440890" type="RegexNormalization" version="extension">
+			<data global_replace="true" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>51</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>2</dim>
+				</port>
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="16" name="StringTensorPack_1440891" type="StringTensorPack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="3" precision="STRING" names="string_output">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="17" name="Result_1440892" type="Result" version="opset1">
+			<input>
+				<port id="0" precision="STRING">
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="1" to-port="0" />
+		<edge from-layer="1" from-port="1" to-layer="10" to-port="0" />
+		<edge from-layer="2" from-port="0" to-layer="3" to-port="0" />
+		<edge from-layer="3" from-port="1" to-layer="10" to-port="1" />
+		<edge from-layer="3" from-port="2" to-layer="10" to-port="2" />
+		<edge from-layer="3" from-port="3" to-layer="10" to-port="3" />
+		<edge from-layer="4" from-port="0" to-layer="9" to-port="0" />
+		<edge from-layer="5" from-port="0" to-layer="9" to-port="1" />
+		<edge from-layer="6" from-port="0" to-layer="9" to-port="2" />
+		<edge from-layer="7" from-port="0" to-layer="9" to-port="3" />
+		<edge from-layer="8" from-port="0" to-layer="9" to-port="4" />
+		<edge from-layer="9" from-port="5" to-layer="10" to-port="4" />
+		<edge from-layer="10" from-port="7" to-layer="11" to-port="2" />
+		<edge from-layer="10" from-port="9" to-layer="12" to-port="2" />
+		<edge from-layer="10" from-port="8" to-layer="11" to-port="3" />
+		<edge from-layer="10" from-port="6" to-layer="11" to-port="1" />
+		<edge from-layer="10" from-port="5" to-layer="11" to-port="0" />
+		<edge from-layer="11" from-port="4" to-layer="12" to-port="0" />
+		<edge from-layer="11" from-port="5" to-layer="12" to-port="1" />
+		<edge from-layer="12" from-port="3" to-layer="15" to-port="0" />
+		<edge from-layer="12" from-port="4" to-layer="15" to-port="1" />
+		<edge from-layer="12" from-port="5" to-layer="15" to-port="2" />
+		<edge from-layer="13" from-port="0" to-layer="15" to-port="3" />
+		<edge from-layer="14" from-port="0" to-layer="15" to-port="4" />
+		<edge from-layer="15" from-port="5" to-layer="16" to-port="0" />
+		<edge from-layer="15" from-port="6" to-layer="16" to-port="1" />
+		<edge from-layer="15" from-port="7" to-layer="16" to-port="2" />
+		<edge from-layer="16" from-port="3" to-layer="17" to-port="0" />
+	</edges>
+	<rt_info>
+		<add_attention_mask value="True" />
+		<add_prefix_space />
+		<add_special_tokens value="True" />
+		<clean_up_tokenization_spaces />
+		<detokenizer_input_type value="i64" />
+		<eos_token_id value="0" />
+		<handle_special_tokens_with_re />
+		<number_of_inputs value="1" />
+		<openvino_tokenizers_version value="2025.0.0.0" />
+		<openvino_version value="2025.0.0" />
+		<original_tokenizer_class value="&lt;class 'transformers.tokenization_utils_fast.PreTrainedTokenizerFast'>" />
+		<pad_token_id value="0" />
+		<sentencepiece_version value="0.2.0" />
+		<skip_special_tokens value="True" />
+		<streaming_detokenizer value="False" />
+		<tiktoken_version value="0.9.0" />
+		<tokenizer_output_type value="i64" />
+		<tokenizers_version value="0.21.0" />
+		<transformers_version value="4.48.3" />
+		<use_max_padding value="False" />
+		<use_sentencepiece_backend value="False" />
+		<utf8_replace_mode value="replace" />
+		<with_detokenizer value="True" />
+	</rt_info>
+</net>

openvino_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c49f586d3f6dcc279b8246ddeaa062c987189c7b10ab3ec2f76bd8a8d23b8d8b
+size 7182306708

openvino_model.xml ADDED Viewed

The diff for this file is too large to render. See raw diff

openvino_tokenizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e39228abb37f0d292daaf8637af5d9ecfbe6a1860908c330cbfcfb5753adccf6
+size 2474485

openvino_tokenizer.xml ADDED Viewed

	@@ -0,0 +1,648 @@

+<?xml version="1.0"?>
+<net name="tokenizer" version="11">
+	<layers>
+		<layer id="0" name="Parameter_1440774" type="Parameter" version="opset1">
+			<data shape="?" element_type="string" />
+			<output>
+				<port id="0" precision="STRING" names="Parameter_1440774">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="Constant_1440780" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="2" name="StringTensorUnpack_1440775" type="StringTensorUnpack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="STRING">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="3" name="ShapeOf_1440776" type="ShapeOf" version="opset3">
+			<data output_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64">
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="Constant_1440777" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="5" name="Constant_1440778" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="0" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="6" name="Gather_1440779" type="Gather" version="opset8">
+			<data batch_dims="0" />
+			<input>
+				<port id="0" precision="I64">
+					<dim>1</dim>
+				</port>
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I64" />
+			</output>
+		</layer>
+		<layer id="7" name="Constant_1440781" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="8" name="Range_1440782" type="Range" version="opset4">
+			<data output_type="i32" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="Constant_1440783" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="10" name="Constant_1440784" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="11" name="Add_1440785" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+			</input>
+			<output>
+				<port id="2" precision="I64" />
+			</output>
+		</layer>
+		<layer id="12" name="Constant_1440786" type="Const" version="opset1">
+			<data element_type="i64" shape="" offset="8" size="8" />
+			<output>
+				<port id="0" precision="I64" />
+			</output>
+		</layer>
+		<layer id="13" name="Range_1440787" type="Range" version="opset4">
+			<data output_type="i32" />
+			<input>
+				<port id="0" precision="I64" />
+				<port id="1" precision="I64" />
+				<port id="2" precision="I64" />
+			</input>
+			<output>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="14" name="Constant_1440849" type="Const" version="opset1">
+			<data element_type="u8" shape="19" offset="16" size="19" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>19</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="15" name="SpecialTokensSplit_1440850" type="SpecialTokensSplit" version="extension">
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="U8">
+					<dim>19</dim>
+				</port>
+			</input>
+			<output>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="16" name="Constant_1440852" type="Const" version="opset1">
+			<data element_type="u8" shape="64" offset="35" size="64" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>64</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="17" name="RegexSplit_1440853" type="RegexSplit" version="extension">
+			<data behaviour="isolate" invert="false" max_splits="-1" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="U8">
+					<dim>64</dim>
+				</port>
+			</input>
+			<output>
+				<port id="7" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="12" precision="BOOL">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="18" name="Constant_1440855" type="Const" version="opset1">
+			<data element_type="u8" shape="1068575" offset="99" size="1068575" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>1068575</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="19" name="StringTensorUnpack_1440856" type="StringTensorUnpack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="U8">
+					<dim>1068575</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="20" name="Constant_1440858" type="Const" version="opset1">
+			<data element_type="u8" shape="732676" offset="1068674" size="732676" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>732676</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="21" name="StringTensorUnpack_1440859" type="StringTensorUnpack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="U8">
+					<dim>732676</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="22" name="Constant_1440861" type="Const" version="opset1">
+			<data element_type="u8" shape="673127" offset="1801350" size="673127" />
+			<output>
+				<port id="0" precision="U8">
+					<dim>673127</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="23" name="StringTensorUnpack_1440862" type="StringTensorUnpack" version="extension">
+			<data mode="begins_ends" />
+			<input>
+				<port id="0" precision="U8">
+					<dim>673127</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="24" name="BPETokenizer_1440863" type="BPETokenizer" version="extension">
+			<data unk_token="" fuse_unk="false" suffix_indicator="" end_suffix="" byte_fallback="false" cache_capacity="20000" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="4" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="7" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="8" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="9" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="10" precision="U8">
+					<dim>-1</dim>
+				</port>
+				<port id="11" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="12" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="13" precision="U8">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="14" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="15" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="16" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="25" name="Subtract_1440864" type="Subtract" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="26" name="Constant_1440865" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="2474477" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="27" name="Minimum_1440866" type="Minimum" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="28" name="Subtract_1440867" type="Subtract" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="29" name="Subtract_1440868" type="Subtract" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="30" name="Constant_1440869" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="2474481" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="31" name="ReduceMax_1440870" type="ReduceMax" version="opset1">
+			<data keep_dims="false" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32" />
+			</input>
+			<output>
+				<port id="2" precision="I32" />
+			</output>
+		</layer>
+		<layer id="32" name="Constant_1440871" type="Const" version="opset1">
+			<data element_type="i32" shape="" offset="2474481" size="4" />
+			<output>
+				<port id="0" precision="I32" />
+			</output>
+		</layer>
+		<layer id="33" name="RaggedToDense_1440872" type="RaggedToDense" version="extension">
+			<data pad_right="false" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="2" precision="I32">
+					<dim>-1</dim>
+				</port>
+				<port id="3" precision="I32" />
+				<port id="4" precision="I32" />
+			</input>
+			<output>
+				<port id="5" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+				<port id="6" precision="BOOL">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="34" name="Convert_1440873" type="Convert" version="opset1">
+			<data destination_type="i32" />
+			<input>
+				<port id="0" precision="BOOL">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="35" name="Convert_1440873.0" type="Convert" version="opset1">
+			<data destination_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64" names="attention_mask">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="37" name="RaggedToDense_1440872.0" type="Convert" version="opset1">
+			<data destination_type="i64" />
+			<input>
+				<port id="0" precision="I32">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="I64" names="input_ids">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="38" name="Result_1440874" type="Result" version="opset1">
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+		<layer id="36" name="Result_1440875" type="Result" version="opset1">
+			<input>
+				<port id="0" precision="I64">
+					<dim>-1</dim>
+					<dim>-1</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="2" to-port="0" />
+		<edge from-layer="1" from-port="0" to-layer="8" to-port="0" />
+		<edge from-layer="2" from-port="1" to-layer="3" to-port="0" />
+		<edge from-layer="2" from-port="3" to-layer="15" to-port="4" />
+		<edge from-layer="2" from-port="2" to-layer="15" to-port="3" />
+		<edge from-layer="2" from-port="1" to-layer="15" to-port="2" />
+		<edge from-layer="3" from-port="1" to-layer="6" to-port="0" />
+		<edge from-layer="4" from-port="0" to-layer="6" to-port="1" />
+		<edge from-layer="5" from-port="0" to-layer="6" to-port="2" />
+		<edge from-layer="6" from-port="3" to-layer="11" to-port="0" />
+		<edge from-layer="6" from-port="3" to-layer="8" to-port="1" />
+		<edge from-layer="7" from-port="0" to-layer="8" to-port="2" />
+		<edge from-layer="8" from-port="3" to-layer="15" to-port="0" />
+		<edge from-layer="9" from-port="0" to-layer="13" to-port="0" />
+		<edge from-layer="10" from-port="0" to-layer="11" to-port="1" />
+		<edge from-layer="11" from-port="2" to-layer="13" to-port="1" />
+		<edge from-layer="12" from-port="0" to-layer="13" to-port="2" />
+		<edge from-layer="13" from-port="3" to-layer="15" to-port="1" />
+		<edge from-layer="14" from-port="0" to-layer="15" to-port="5" />
+		<edge from-layer="15" from-port="6" to-layer="17" to-port="0" />
+		<edge from-layer="15" from-port="7" to-layer="17" to-port="1" />
+		<edge from-layer="15" from-port="8" to-layer="17" to-port="2" />
+		<edge from-layer="15" from-port="9" to-layer="17" to-port="3" />
+		<edge from-layer="15" from-port="10" to-layer="17" to-port="4" />
+		<edge from-layer="15" from-port="11" to-layer="17" to-port="5" />
+		<edge from-layer="16" from-port="0" to-layer="17" to-port="6" />
+		<edge from-layer="17" from-port="11" to-layer="24" to-port="4" />
+		<edge from-layer="17" from-port="10" to-layer="24" to-port="3" />
+		<edge from-layer="17" from-port="9" to-layer="24" to-port="2" />
+		<edge from-layer="17" from-port="8" to-layer="24" to-port="1" />
+		<edge from-layer="17" from-port="7" to-layer="24" to-port="0" />
+		<edge from-layer="18" from-port="0" to-layer="19" to-port="0" />
+		<edge from-layer="19" from-port="1" to-layer="24" to-port="5" />
+		<edge from-layer="19" from-port="2" to-layer="24" to-port="6" />
+		<edge from-layer="19" from-port="3" to-layer="24" to-port="7" />
+		<edge from-layer="20" from-port="0" to-layer="21" to-port="0" />
+		<edge from-layer="21" from-port="1" to-layer="24" to-port="8" />
+		<edge from-layer="21" from-port="2" to-layer="24" to-port="9" />
+		<edge from-layer="21" from-port="3" to-layer="24" to-port="10" />
+		<edge from-layer="22" from-port="0" to-layer="23" to-port="0" />
+		<edge from-layer="23" from-port="1" to-layer="24" to-port="11" />
+		<edge from-layer="23" from-port="3" to-layer="24" to-port="13" />
+		<edge from-layer="23" from-port="2" to-layer="24" to-port="12" />
+		<edge from-layer="24" from-port="15" to-layer="25" to-port="0" />
+		<edge from-layer="24" from-port="14" to-layer="25" to-port="1" />
+		<edge from-layer="24" from-port="15" to-layer="28" to-port="0" />
+		<edge from-layer="24" from-port="16" to-layer="33" to-port="2" />
+		<edge from-layer="24" from-port="15" to-layer="29" to-port="0" />
+		<edge from-layer="24" from-port="15" to-layer="33" to-port="1" />
+		<edge from-layer="25" from-port="2" to-layer="27" to-port="0" />
+		<edge from-layer="26" from-port="0" to-layer="27" to-port="1" />
+		<edge from-layer="27" from-port="2" to-layer="28" to-port="1" />
+		<edge from-layer="28" from-port="2" to-layer="33" to-port="0" />
+		<edge from-layer="28" from-port="2" to-layer="29" to-port="1" />
+		<edge from-layer="29" from-port="2" to-layer="31" to-port="0" />
+		<edge from-layer="30" from-port="0" to-layer="31" to-port="1" />
+		<edge from-layer="31" from-port="2" to-layer="33" to-port="3" />
+		<edge from-layer="32" from-port="0" to-layer="33" to-port="4" />
+		<edge from-layer="33" from-port="6" to-layer="34" to-port="0" />
+		<edge from-layer="33" from-port="5" to-layer="37" to-port="0" />
+		<edge from-layer="34" from-port="1" to-layer="35" to-port="0" />
+		<edge from-layer="35" from-port="1" to-layer="36" to-port="0" />
+		<edge from-layer="37" from-port="1" to-layer="38" to-port="0" />
+	</edges>
+	<rt_info>
+		<add_attention_mask value="True" />
+		<add_prefix_space />
+		<add_special_tokens value="True" />
+		<clean_up_tokenization_spaces />
+		<detokenizer_input_type value="i64" />
+		<eos_token_id value="0" />
+		<handle_special_tokens_with_re />
+		<number_of_inputs value="1" />
+		<openvino_tokenizers_version value="2025.0.0.0" />
+		<openvino_version value="2025.0.0" />
+		<original_tokenizer_class value="&lt;class 'transformers.tokenization_utils_fast.PreTrainedTokenizerFast'>" />
+		<pad_token_id value="0" />
+		<sentencepiece_version value="0.2.0" />
+		<skip_special_tokens value="True" />
+		<streaming_detokenizer value="False" />
+		<tiktoken_version value="0.9.0" />
+		<tokenizer_output_type value="i64" />
+		<tokenizers_version value="0.21.0" />
+		<transformers_version value="4.48.3" />
+		<use_max_padding value="False" />
+		<use_sentencepiece_backend value="False" />
+		<utf8_replace_mode value="replace" />
+		<with_detokenizer value="True" />
+	</rt_info>
+</net>

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "eos_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<|endoftext|>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|endoftext|>",
+  "extra_special_tokens": {},
+  "model_max_length": 2048,
+  "pad_token": "<|endoftext|>",
+  "tokenizer_class": "PreTrainedTokenizerFast",
+  "unk_token": "<|endoftext|>"
+}