Upload tiny random Llama-3.3 model (seed 42)

Files changed (3) hide show

README.md CHANGED Viewed

@@ -24,8 +24,8 @@ This is a tiny random version of the JackFram/llama-68m model, created for testi
 ## Parameters
-- **Total parameters**: ~43,455,744
-- **Trainable parameters**: ~43,455,744
 ## Usage

 ## Parameters
+- **Total parameters**: ~43,454,976
+- **Trainable parameters**: ~43,454,976
 ## Usage

config.json CHANGED Viewed

@@ -9,8 +9,14 @@
   "head_dim": 64,
   "hidden_act": "silu",
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "max_position_embeddings": 2048,
   "mlp_bias": false,
   "model_type": "llama",

   "head_dim": 64,
   "hidden_act": "silu",
   "hidden_size": 768,
+  "id2label": {
+    "0": "LABEL_0"
+  },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
+  "label2id": {
+    "LABEL_0": 0
+  },
   "max_position_embeddings": 2048,
   "mlp_bias": false,
   "model_type": "llama",

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c302b9615e186442df724d79c3c1e75215e82ee241a4bde6070f3fb0ccfdd5a8
-size 173825280

 version https://git-lfs.github.com/spec/v1
+oid sha256:64feec5fef66d9a9708fe6ed1dfa6d85d8971dd6b7f744ce88a3d53493b225c3
+size 173822208