Upload checkpoints

Files changed (4) hide show

ckpt_72/config.json ADDED Viewed

+{
+  "architectures": [
+    "GPT"
+  ],
+  "batch_size": 8,
+  "context_len": 1024,
+  "d_model": 768,
+  "device": "cuda",
+  "dtype": "float32",
+  "intermidiate_size": 3072,
+  "load_checkpoint": true,
+  "lr": 0.0006,
+  "model_type": "gpt_custom",
+  "n_epoch": 5,
+  "n_heads": 12,
+  "n_layers": 12,
+  "transformers_version": "4.56.0",
+  "vocab_size": 50304,
+  "weight_decay": 0.1
+}

ckpt_72/model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c24960ebb01c8ab0bfe6730028d7c7fdbb56a6cd3a21a0e3a90a8fe5eb6daef5
+size 548379944

config.json ADDED Viewed

+{
+  "architectures": [
+    "GPT"
+  ],
+  "batch_size": 8,
+  "context_len": 1024,
+  "d_model": 768,
+  "device": "cpu",
+  "dtype": "float32",
+  "intermidiate_size": 3072,
+  "load_checkpoint": true,
+  "model_type": "gpt_custom",
+  "n_epoch": 5,
+  "n_heads": 12,
+  "n_layers": 12,
+  "transformers_version": "4.56.0",
+  "vocab_size": 50304,
+  "weight_decay": 0.1
+}

optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2900fe36dc65e84276054679b9b5d0cf4067b1f671611307658c50e013b891b7
+size 996203019