Upload model

Files changed (6) hide show

config.json CHANGED Viewed

@@ -1,6 +1,5 @@
 {
-  "_attn_implementation_autoset": true,
-  "_name_or_path": "../checkpoints/comment_resolution/pointers/epoch_2",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -15,7 +14,7 @@
   "intermediate_size": 5504,
   "max_position_embeddings": 16384,
   "mlp_bias": false,
-  "model_path": "/tmp/tmp9qbfkkek/model",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "num_key_value_heads": 16,
@@ -28,9 +27,9 @@
   },
   "rope_theta": 100000,
   "tie_word_embeddings": false,
-  "tokenizer_path": "/tmp/tmp9qbfkkek/tokenizer",
   "torch_dtype": "float32",
-  "transformers_version": "4.47.0",
   "use_cache": true,
   "vocab_size": 32027
 }

 {
+  "_name_or_path": "../checkpoints/comment_resolution/training/model/deepseek-ai/deepseek-coder-1.3b-instruct_with_new_tokens_three_edits_fixed/epoch_1",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "intermediate_size": 5504,
   "max_position_embeddings": 16384,
   "mlp_bias": false,
+  "model_path": "/tmp/tmpvlynhjyy/model",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "num_key_value_heads": 16,
   },
   "rope_theta": 100000,
   "tie_word_embeddings": false,
+  "tokenizer_path": "/tmp/tmpvlynhjyy/tokenizer",
   "torch_dtype": "float32",
+  "transformers_version": "4.47.1",
   "use_cache": true,
   "vocab_size": 32027
 }

model/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "../checkpoints/comment_resolution/pointers/epoch_2",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -28,7 +28,7 @@
   "rope_theta": 100000,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.47.0",
   "use_cache": true,
   "vocab_size": 32027
 }

 {
+  "_name_or_path": "../checkpoints/comment_resolution/training/model/deepseek-ai/deepseek-coder-1.3b-instruct_with_new_tokens_three_edits_fixed/epoch_1",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "rope_theta": 100000,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.47.1",
   "use_cache": true,
   "vocab_size": 32027
 }

model/generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 32013,
   "eos_token_id": 32021,
-  "transformers_version": "4.47.0"
 }

   "_from_model_config": true,
   "bos_token_id": 32013,
   "eos_token_id": 32021,
+  "transformers_version": "4.47.1"
 }

model/model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c606966dc0a3e2d0663862534df14fe4d7678a79d067525b8589f61993861349
 size 4984504096

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb946d583830f7c9e0553ebf705075fbbc9e2107afead3894d5bea0853deed92
 size 4984504096

model/model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:396d3836d7b16186089fc5f8b89f10bb546640a059a6230fd8385078777925b4
 size 397656840

 version https://git-lfs.github.com/spec/v1
+oid sha256:81979ac52e1b4f5b49637f761eb6ebe41d664d8d4ad73e2dc76abdd85b63dd31
 size 397656840

pointer_projection.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:177f773bba6f31a6466620a810b8bab06743bd2ac9e97e1a6f4a5a77ab17eebe
 size 16786970

 version https://git-lfs.github.com/spec/v1
+oid sha256:dd54d7dcefec419c694337b906c43fdb4543369529d71fc568969b0fb8dc3b6b
 size 16786970