geobase
/

geo-task-classifier-transformer

Text Classification

Transformers

Safetensors

bert

Generated from Trainer

Model card Files Files and versions Community

mhassanch commited on 21 days ago

Commit

c3b2084

verified ·

1 Parent(s): abee2f8

End of training

Browse files

Files changed (3) hide show

README.md +51 -51
config.json +4 -2
model.safetensors +2 -2

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [nreimers/BERT-Tiny_L-2_H-128_A-2](https://huggingface.co/nreimers/BERT-Tiny_L-2_H-128_A-2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8101
 ## Model description
@@ -46,56 +46,56 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 2    | 1.0244          |
-| No log        | 2.0   | 4    | 1.0190          |
-| No log        | 3.0   | 6    | 1.0148          |
-| No log        | 4.0   | 8    | 1.0122          |
-| No log        | 5.0   | 10   | 1.0101          |
-| No log        | 6.0   | 12   | 1.0061          |
-| No log        | 7.0   | 14   | 1.0020          |
-| No log        | 8.0   | 16   | 0.9957          |
-| No log        | 9.0   | 18   | 0.9890          |
-| No log        | 10.0  | 20   | 0.9804          |
-| No log        | 11.0  | 22   | 0.9692          |
-| No log        | 12.0  | 24   | 0.9561          |
-| No log        | 13.0  | 26   | 0.9443          |
-| No log        | 14.0  | 28   | 0.9345          |
-| No log        | 15.0  | 30   | 0.9262          |
-| No log        | 16.0  | 32   | 0.9178          |
-| No log        | 17.0  | 34   | 0.9089          |
-| No log        | 18.0  | 36   | 0.9011          |
-| No log        | 19.0  | 38   | 0.8937          |
-| No log        | 20.0  | 40   | 0.8868          |
-| No log        | 21.0  | 42   | 0.8807          |
-| No log        | 22.0  | 44   | 0.8757          |
-| No log        | 23.0  | 46   | 0.8714          |
-| No log        | 24.0  | 48   | 0.8671          |
-| No log        | 25.0  | 50   | 0.8626          |
-| No log        | 26.0  | 52   | 0.8581          |
-| No log        | 27.0  | 54   | 0.8537          |
-| No log        | 28.0  | 56   | 0.8499          |
-| No log        | 29.0  | 58   | 0.8457          |
-| No log        | 30.0  | 60   | 0.8423          |
-| No log        | 31.0  | 62   | 0.8395          |
-| No log        | 32.0  | 64   | 0.8364          |
-| No log        | 33.0  | 66   | 0.8334          |
-| No log        | 34.0  | 68   | 0.8307          |
-| No log        | 35.0  | 70   | 0.8281          |
-| No log        | 36.0  | 72   | 0.8259          |
-| No log        | 37.0  | 74   | 0.8238          |
-| No log        | 38.0  | 76   | 0.8223          |
-| No log        | 39.0  | 78   | 0.8206          |
-| No log        | 40.0  | 80   | 0.8192          |
-| No log        | 41.0  | 82   | 0.8181          |
-| No log        | 42.0  | 84   | 0.8170          |
-| No log        | 43.0  | 86   | 0.8159          |
-| No log        | 44.0  | 88   | 0.8146          |
-| No log        | 45.0  | 90   | 0.8134          |
-| No log        | 46.0  | 92   | 0.8122          |
-| No log        | 47.0  | 94   | 0.8115          |
-| No log        | 48.0  | 96   | 0.8108          |
-| No log        | 49.0  | 98   | 0.8102          |
-| No log        | 50.0  | 100  | 0.8101          |
 ### Framework versions

 This model is a fine-tuned version of [nreimers/BERT-Tiny_L-2_H-128_A-2](https://huggingface.co/nreimers/BERT-Tiny_L-2_H-128_A-2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5820
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| No log        | 1.0   | 11   | 1.3285          |
+| No log        | 2.0   | 22   | 1.3144          |
+| No log        | 3.0   | 33   | 1.2977          |
+| No log        | 4.0   | 44   | 1.2683          |
+| No log        | 5.0   | 55   | 1.2476          |
+| No log        | 6.0   | 66   | 1.2256          |
+| No log        | 7.0   | 77   | 1.1961          |
+| No log        | 8.0   | 88   | 1.1853          |
+| No log        | 9.0   | 99   | 1.1625          |
+| No log        | 10.0  | 110  | 1.1284          |
+| No log        | 11.0  | 121  | 1.1036          |
+| No log        | 12.0  | 132  | 1.0812          |
+| No log        | 13.0  | 143  | 1.0573          |
+| No log        | 14.0  | 154  | 1.0323          |
+| No log        | 15.0  | 165  | 1.0092          |
+| No log        | 16.0  | 176  | 0.9913          |
+| No log        | 17.0  | 187  | 0.9725          |
+| No log        | 18.0  | 198  | 0.9492          |
+| No log        | 19.0  | 209  | 0.9269          |
+| No log        | 20.0  | 220  | 0.9061          |
+| No log        | 21.0  | 231  | 0.8869          |
+| No log        | 22.0  | 242  | 0.8719          |
+| No log        | 23.0  | 253  | 0.8521          |
+| No log        | 24.0  | 264  | 0.8357          |
+| No log        | 25.0  | 275  | 0.8169          |
+| No log        | 26.0  | 286  | 0.8026          |
+| No log        | 27.0  | 297  | 0.7936          |
+| No log        | 28.0  | 308  | 0.7783          |
+| No log        | 29.0  | 319  | 0.7677          |
+| No log        | 30.0  | 330  | 0.7577          |
+| No log        | 31.0  | 341  | 0.7516          |
+| No log        | 32.0  | 352  | 0.7431          |
+| No log        | 33.0  | 363  | 0.7355          |
+| No log        | 34.0  | 374  | 0.7287          |
+| No log        | 35.0  | 385  | 0.7220          |
+| No log        | 36.0  | 396  | 0.7154          |
+| No log        | 37.0  | 407  | 0.7119          |
+| No log        | 38.0  | 418  | 0.7073          |
+| No log        | 39.0  | 429  | 0.7025          |
+| No log        | 40.0  | 440  | 0.6976          |
+| No log        | 41.0  | 451  | 0.6931          |
+| No log        | 42.0  | 462  | 0.6890          |
+| No log        | 43.0  | 473  | 0.6859          |
+| No log        | 44.0  | 484  | 0.6830          |
+| No log        | 45.0  | 495  | 0.6807          |
+| 0.7544        | 46.0  | 506  | 0.6785          |
+| 0.7544        | 47.0  | 517  | 0.6774          |
+| 0.7544        | 48.0  | 528  | 0.6769          |
+| 0.7544        | 49.0  | 539  | 0.6768          |
+| 0.7544        | 50.0  | 550  | 0.6767          |
 ### Framework versions

config.json CHANGED Viewed

@@ -12,14 +12,16 @@
   "id2label": {
     "0": "LABEL_0",
     "1": "LABEL_1",
-    "2": "LABEL_2"
   },
   "initializer_range": 0.02,
   "intermediate_size": 512,
   "label2id": {
     "LABEL_0": 0,
     "LABEL_1": 1,
-    "LABEL_2": 2
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

   "id2label": {
     "0": "LABEL_0",
     "1": "LABEL_1",
+    "2": "LABEL_2",
+    "3": "LABEL_3"
   },
   "initializer_range": 0.02,
   "intermediate_size": 512,
   "label2id": {
     "LABEL_0": 0,
     "LABEL_1": 1,
+    "LABEL_2": 2,
+    "LABEL_3": 3
   },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c818cf7aa403918ad77dd97938282b3e40df58b610b4b70460cbd2e891021263
-size 17549828

 version https://git-lfs.github.com/spec/v1
+oid sha256:decefbdd01015cd92a9e9f33d14cf3abbf63c54bfa72b28450407d07d7f38e2a
+size 17550344