Upload checkpoints

Files changed (5) hide show

ckpt_7800/config.json ADDED Viewed

+{
+  "architectures": [
+    "GPT"
+  ],
+  "batch_size": 8,
+  "context_len": 1024,
+  "d_model": 768,
+  "device": "cuda",
+  "dtype": "float32",
+  "intermidiate_size": 3072,
+  "load_checkpoint": true,
+  "lr": 0.0006,
+  "model_type": "gpt_custom",
+  "n_epoch": 5,
+  "n_heads": 12,
+  "n_layers": 12,
+  "transformers_version": "4.56.1",
+  "vocab_size": 50304,
+  "weight_decay": 0.1
+}

ckpt_7800/model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1f4cefe98d00469f81e2e192ac302f5b621ef104280d8c4c8a3cf844b76c1ab
+size 548379944

ckpt_7950/config.json ADDED Viewed

+{
+  "architectures": [
+    "GPT"
+  ],
+  "batch_size": 8,
+  "context_len": 1024,
+  "d_model": 768,
+  "device": "cuda",
+  "dtype": "float32",
+  "intermidiate_size": 3072,
+  "load_checkpoint": true,
+  "lr": 0.0006,
+  "model_type": "gpt_custom",
+  "n_epoch": 5,
+  "n_heads": 12,
+  "n_layers": 12,
+  "transformers_version": "4.56.1",
+  "vocab_size": 50304,
+  "weight_decay": 0.1
+}

ckpt_7950/model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7bda829f0daf7d24ef6dbd7d437961a28d0ebb818c424dd29d97664710087859
+size 548379944

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:37ca93a16aa233a9d3389db46656bf374686b16b7653f351a99d8e3751c25041
 size 996203019

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce237fb6d76df053a3cd07e97979ea5594937e559c748c95898044e6e5154a1e
 size 996203019