Training in progress, step 5000

Browse files

Files changed (10) hide show

adapter_config.json +34 -0
adapter_model.safetensors +3 -0
special_tokens_map.json +24 -0
tokenized_dataset/data-00000-of-00001.arrow +3 -0
tokenized_dataset/dataset_info.json +62 -0
tokenized_dataset/state.json +13 -0
tokenizer.json +0 -0
tokenizer.model +3 -0
tokenizer_config.json +0 -0
training_args.bin +3 -0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "mistralai/Mistral-7B-v0.3",
+  "bias": "none",
+  "eva_config": null,
+  "exclude_modules": null,
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 64,
+  "lora_bias": false,
+  "lora_dropout": 0.1,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 32,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj",
+    "o_proj",
+    "k_proj"
+  ],
+  "task_type": "CAUSAL_LM",
+  "use_dora": false,
+  "use_rslora": false
+}

adapter_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c3807a956cf96cee9eefa34c83870f32729f878dfffa75d71623b0930d82b63
+size 109086416

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "</s>",
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenized_dataset/data-00000-of-00001.arrow ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93d2f55720a9a9107206242fdddeee5844efdac239b4dc92adc6dd51df9a69b2
+size 232226680

tokenized_dataset/dataset_info.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "builder_name": "parquet",
+  "citation": "",
+  "config_name": "default",
+  "dataset_name": "disease-diagnosis-dataset",
+  "dataset_size": 126706598,
+  "description": "",
+  "download_checksums": {
+    "hf://datasets/sajjadhadi/disease-diagnosis-dataset@d6112cea985c4219069791c7c20010d81e945698/data/train-00000-of-00001.parquet": {
+      "num_bytes": 27292179,
+      "checksum": null
+    },
+    "hf://datasets/sajjadhadi/disease-diagnosis-dataset@d6112cea985c4219069791c7c20010d81e945698/data/test-00000-of-00001.parquet": {
+      "num_bytes": 1151308,
+      "checksum": null
+    }
+  },
+  "download_size": 28443487,
+  "features": {
+    "diagnosis": {
+      "dtype": "string",
+      "_type": "Value"
+    },
+    "input_ids": {
+      "feature": {
+        "dtype": "int32",
+        "_type": "Value"
+      },
+      "_type": "Sequence"
+    },
+    "attention_mask": {
+      "feature": {
+        "dtype": "int8",
+        "_type": "Value"
+      },
+      "_type": "Sequence"
+    }
+  },
+  "homepage": "",
+  "license": "",
+  "size_in_bytes": 155150085,
+  "splits": {
+    "train": {
+      "name": "train",
+      "num_bytes": 120825750,
+      "num_examples": 469195,
+      "dataset_name": "disease-diagnosis-dataset"
+    },
+    "test": {
+      "name": "test",
+      "num_bytes": 5880848,
+      "num_examples": 24695,
+      "dataset_name": "disease-diagnosis-dataset"
+    }
+  },
+  "version": {
+    "version_str": "0.0.0",
+    "major": 0,
+    "minor": 0,
+    "patch": 0
+  }
+}

tokenized_dataset/state.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "_data_files": [
+    {
+      "filename": "data-00000-of-00001.arrow"
+    }
+  ],
+  "_fingerprint": "52f34413087e7b4b",
+  "_format_columns": null,
+  "_format_kwargs": {},
+  "_format_type": null,
+  "_output_all_columns": false,
+  "_split": "train"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:37f00374dea48658ee8f5d0f21895b9bc55cb0103939607c8185bfd1c6ca1f89
+size 587404

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:24441d97e761dfbc5690848cbd81d62dfb1de543e0ac30865a1ad7ef95837af7
+size 5560