CV-INSIDE/vit-base-kidney-stone

Browse files

Files changed (9) hide show

README.md +93 -0
all_results.json +15 -0
config.json +40 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
test_results.json +11 -0
train_results.json +7 -0
trainer_state.json +426 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,93 @@

+---
+license: apache-2.0
+base_model: google/vit-base-patch16-224-in21k
+tags:
+- generated_from_trainer
+datasets:
+- imagefolder
+metrics:
+- accuracy
+- precision
+- recall
+- f1
+model-index:
+- name: vit-base-kidney-stone
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: imagefolder
+      type: imagefolder
+      config: default
+      split: test
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.8616666666666667
+    - name: Precision
+      type: precision
+      value: 0.8822395663345405
+    - name: Recall
+      type: recall
+      value: 0.8616666666666667
+    - name: F1
+      type: f1
+      value: 0.862283860702826
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# vit-base-kidney-stone
+This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.4868
+- Accuracy: 0.8617
+- Precision: 0.8822
+- Recall: 0.8617
+- F1: 0.8623
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0002
+- train_batch_size: 32
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 1
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| 0.207         | 0.33  | 100  | 0.5822          | 0.8237   | 0.8413    | 0.8237 | 0.8268 |
+| 0.1275        | 0.67  | 200  | 0.5722          | 0.8267   | 0.8338    | 0.8267 | 0.8287 |
+| 0.0313        | 1.0   | 300  | 0.4868          | 0.8617   | 0.8822    | 0.8617 | 0.8623 |
+### Framework versions
+- Transformers 4.37.2
+- Pytorch 2.1.1
+- Datasets 3.1.0
+- Tokenizers 0.15.2

all_results.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+    "epoch": 1.0,
+    "eval_accuracy": 0.8616666666666667,
+    "eval_f1": 0.862283860702826,
+    "eval_loss": 0.4867922067642212,
+    "eval_precision": 0.8822395663345405,
+    "eval_recall": 0.8616666666666667,
+    "eval_runtime": 42.1824,
+    "eval_samples_per_second": 56.896,
+    "eval_steps_per_second": 7.112,
+    "train_loss": 0.2792618449529012,
+    "train_runtime": 263.2327,
+    "train_samples_per_second": 36.47,
+    "train_steps_per_second": 1.14
+}

config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "google/vit-base-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "MIX-Subtype_IVa",
+    "1": "MIX-Subtype_IVa2",
+    "2": "MIX-Subtype_IVc",
+    "3": "MIX-Subtype_IVd",
+    "4": "MIX-Subtype_Ia",
+    "5": "MIX-Subtype_Va"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "MIX-Subtype_IVa": "0",
+    "MIX-Subtype_IVa2": "1",
+    "MIX-Subtype_IVc": "2",
+    "MIX-Subtype_IVd": "3",
+    "MIX-Subtype_Ia": "4",
+    "MIX-Subtype_Va": "5"
+  },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
+  "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4db40a86ba1fd0e32267b43f9124056d79ff2f5f33d83255f91fdb563f0056aa
+size 343236280

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

test_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 1.0,
+    "eval_accuracy": 0.8616666666666667,
+    "eval_f1": 0.862283860702826,
+    "eval_loss": 0.4867922067642212,
+    "eval_precision": 0.8822395663345405,
+    "eval_recall": 0.8616666666666667,
+    "eval_runtime": 42.1824,
+    "eval_samples_per_second": 56.896,
+    "eval_steps_per_second": 7.112
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 1.0,
+    "train_loss": 0.2792618449529012,
+    "train_runtime": 263.2327,
+    "train_samples_per_second": 36.47,
+    "train_steps_per_second": 1.14
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,426 @@

+{
+  "best_metric": 0.4867922067642212,
+  "best_model_checkpoint": "./vit-base-kidney-stone\\checkpoint-300",
+  "epoch": 1.0,
+  "eval_steps": 100,
+  "global_step": 300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.02,
+      "learning_rate": 0.00019666666666666666,
+      "loss": 1.7127,
+      "step": 5
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 0.00019333333333333333,
+      "loss": 1.4819,
+      "step": 10
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.00019,
+      "loss": 1.196,
+      "step": 15
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 0.0001866666666666667,
+      "loss": 0.9416,
+      "step": 20
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.00018333333333333334,
+      "loss": 0.7936,
+      "step": 25
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.00018,
+      "loss": 0.7043,
+      "step": 30
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 0.00017666666666666666,
+      "loss": 0.8164,
+      "step": 35
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 0.00017333333333333334,
+      "loss": 0.6153,
+      "step": 40
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00017,
+      "loss": 0.5327,
+      "step": 45
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 0.0001666666666666667,
+      "loss": 0.5316,
+      "step": 50
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 0.00016333333333333334,
+      "loss": 0.442,
+      "step": 55
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.00016,
+      "loss": 0.4206,
+      "step": 60
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 0.00015666666666666666,
+      "loss": 0.3947,
+      "step": 65
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00015333333333333334,
+      "loss": 0.3422,
+      "step": 70
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.00015000000000000001,
+      "loss": 0.3973,
+      "step": 75
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 0.00014666666666666666,
+      "loss": 0.302,
+      "step": 80
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 0.00014333333333333334,
+      "loss": 0.2885,
+      "step": 85
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00014,
+      "loss": 0.1784,
+      "step": 90
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 0.00013666666666666666,
+      "loss": 0.2273,
+      "step": 95
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.00013333333333333334,
+      "loss": 0.207,
+      "step": 100
+    },
+    {
+      "epoch": 0.33,
+      "eval_accuracy": 0.82375,
+      "eval_f1": 0.8267992833893669,
+      "eval_loss": 0.582241415977478,
+      "eval_precision": 0.8413405833504677,
+      "eval_recall": 0.82375,
+      "eval_runtime": 40.0025,
+      "eval_samples_per_second": 59.996,
+      "eval_steps_per_second": 7.5,
+      "step": 100
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 0.00013000000000000002,
+      "loss": 0.1732,
+      "step": 105
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 0.00012666666666666666,
+      "loss": 0.2279,
+      "step": 110
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 0.00012333333333333334,
+      "loss": 0.1756,
+      "step": 115
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 0.00012,
+      "loss": 0.143,
+      "step": 120
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.00011666666666666668,
+      "loss": 0.2222,
+      "step": 125
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 0.00011333333333333334,
+      "loss": 0.1897,
+      "step": 130
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 0.00011000000000000002,
+      "loss": 0.2283,
+      "step": 135
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.00010666666666666667,
+      "loss": 0.1815,
+      "step": 140
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 0.00010333333333333334,
+      "loss": 0.174,
+      "step": 145
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 0.0001,
+      "loss": 0.1429,
+      "step": 150
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 9.666666666666667e-05,
+      "loss": 0.0953,
+      "step": 155
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 9.333333333333334e-05,
+      "loss": 0.1442,
+      "step": 160
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 9e-05,
+      "loss": 0.1944,
+      "step": 165
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 8.666666666666667e-05,
+      "loss": 0.1636,
+      "step": 170
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 8.333333333333334e-05,
+      "loss": 0.1008,
+      "step": 175
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 8e-05,
+      "loss": 0.1728,
+      "step": 180
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 7.666666666666667e-05,
+      "loss": 0.0754,
+      "step": 185
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 7.333333333333333e-05,
+      "loss": 0.0634,
+      "step": 190
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 7e-05,
+      "loss": 0.0519,
+      "step": 195
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 0.1275,
+      "step": 200
+    },
+    {
+      "epoch": 0.67,
+      "eval_accuracy": 0.8266666666666667,
+      "eval_f1": 0.8287125800085143,
+      "eval_loss": 0.572192907333374,
+      "eval_precision": 0.8337568888460007,
+      "eval_recall": 0.8266666666666667,
+      "eval_runtime": 40.0669,
+      "eval_samples_per_second": 59.9,
+      "eval_steps_per_second": 7.487,
+      "step": 200
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 6.333333333333333e-05,
+      "loss": 0.0879,
+      "step": 205
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 6e-05,
+      "loss": 0.0707,
+      "step": 210
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 5.666666666666667e-05,
+      "loss": 0.0993,
+      "step": 215
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 5.333333333333333e-05,
+      "loss": 0.0539,
+      "step": 220
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 5e-05,
+      "loss": 0.0641,
+      "step": 225
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.666666666666667e-05,
+      "loss": 0.0443,
+      "step": 230
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.3333333333333334e-05,
+      "loss": 0.0532,
+      "step": 235
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4e-05,
+      "loss": 0.0562,
+      "step": 240
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.6666666666666666e-05,
+      "loss": 0.0919,
+      "step": 245
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.0582,
+      "step": 250
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3e-05,
+      "loss": 0.0633,
+      "step": 255
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.0591,
+      "step": 260
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.3333333333333336e-05,
+      "loss": 0.039,
+      "step": 265
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2e-05,
+      "loss": 0.0323,
+      "step": 270
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0513,
+      "step": 275
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.0829,
+      "step": 280
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 1e-05,
+      "loss": 0.0354,
+      "step": 285
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.0667,
+      "step": 290
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 0.0408,
+      "step": 295
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 0.0,
+      "loss": 0.0313,
+      "step": 300
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8616666666666667,
+      "eval_f1": 0.862283860702826,
+      "eval_loss": 0.4867922067642212,
+      "eval_precision": 0.8822395663345405,
+      "eval_recall": 0.8616666666666667,
+      "eval_runtime": 40.1988,
+      "eval_samples_per_second": 59.703,
+      "eval_steps_per_second": 7.463,
+      "step": 300
+    },
+    {
+      "epoch": 1.0,
+      "step": 300,
+      "total_flos": 7.43949770489856e+17,
+      "train_loss": 0.2792618449529012,
+      "train_runtime": 263.2327,
+      "train_samples_per_second": 36.47,
+      "train_steps_per_second": 1.14
+    }
+  ],
+  "logging_steps": 5,
+  "max_steps": 300,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
+  "save_steps": 100,
+  "total_flos": 7.43949770489856e+17,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:471cc49716b6ab271a0f32070cdaedac19120ba2261dd678da46afb3ab6bcac0
+size 4728