Spaces:

gyrojeff
/

YuzuMarker.FontDetection

Running

App Files Files Community

gyrojeff commited on Apr 4, 2023

Commit

bc0f7fc

1 Parent(s): 0693434

feat: double dataset

Browse files

Files changed (2) hide show

detector/data.py +37 -14
train.py +11 -0

detector/data.py CHANGED Viewed

@@ -11,7 +11,7 @@ import torch
 import torchvision.transforms as transforms
 import torchvision.transforms.functional as TF
 from typing import List, Dict, Tuple
-from torch.utils.data import Dataset, DataLoader
 from pytorch_lightning import LightningDataModule
 from PIL import Image
@@ -262,9 +262,9 @@ class FontDataModule(LightningDataModule):
     def __init__(
         self,
         config_path: str = "configs/font.yml",
-        train_path: str = "./dataset/font_img/train",
-        val_path: str = "./dataset/font_img/val",
-        test_path: str = "./dataset/font_img/test",
         train_shuffle: bool = True,
         val_shuffle: bool = False,
         test_shuffle: bool = False,
@@ -280,18 +280,41 @@ class FontDataModule(LightningDataModule):
         self.train_shuffle = train_shuffle
         self.val_shuffle = val_shuffle
         self.test_shuffle = test_shuffle
-        self.train_dataset = FontDataset(
-            train_path,
-            config_path,
-            regression_use_tanh,
-            train_transforms,
-            crop_roi_bbox,
         )
-        self.val_dataset = FontDataset(
-            val_path, config_path, regression_use_tanh, val_transforms, crop_roi_bbox
         )
-        self.test_dataset = FontDataset(
-            test_path, config_path, regression_use_tanh, test_transforms, crop_roi_bbox
         )
     def get_train_num_iter(self, num_device: int) -> int:

 import torchvision.transforms as transforms
 import torchvision.transforms.functional as TF
 from typing import List, Dict, Tuple
+from torch.utils.data import Dataset, DataLoader, ConcatDataset
 from pytorch_lightning import LightningDataModule
 from PIL import Image
     def __init__(
         self,
         config_path: str = "configs/font.yml",
+        train_paths: List[str] = ["./dataset/font_img/train"],
+        val_paths: List[str] = ["./dataset/font_img/val"],
+        test_paths: List[str] = ["./dataset/font_img/test"],
         train_shuffle: bool = True,
         val_shuffle: bool = False,
         test_shuffle: bool = False,
         self.train_shuffle = train_shuffle
         self.val_shuffle = val_shuffle
         self.test_shuffle = test_shuffle
+        self.train_dataset = ConcatDataset(
+            [
+                FontDataset(
+                    train_path,
+                    config_path,
+                    regression_use_tanh,
+                    train_transforms,
+                    crop_roi_bbox,
+                )
+                for train_path in train_paths
+            ]
         )
+        self.val_dataset = ConcatDataset(
+            [
+                FontDataset(
+                    val_path,
+                    config_path,
+                    regression_use_tanh,
+                    val_transforms,
+                    crop_roi_bbox,
+                )
+                for val_path in val_paths
+            ]
         )
+        self.test_dataset = ConcatDataset(
+            [
+                FontDataset(
+                    test_path,
+                    config_path,
+                    regression_use_tanh,
+                    test_transforms,
+                    crop_roi_bbox,
+                )
+                for test_path in test_paths
+            ]
         )
     def get_train_num_iter(self, num_device: int) -> int:

train.py CHANGED Viewed

@@ -69,6 +69,14 @@ parser.add_argument(
     default=0.0001,
     help="Learning rate (default: 0.0001)",
 )
 args = parser.parse_args()
@@ -97,6 +105,9 @@ log_every_n_steps = 100
 num_device = len(devices)
 data_module = FontDataModule(
     batch_size=single_batch_size,
     num_workers=single_device_num_workers,
     pin_memory=True,

     default=0.0001,
     help="Learning rate (default: 0.0001)",
 )
+parser.add_argument(
+    "-s",
+    "--datasets",
+    nargs="*",
+    type=str,
+    default=["./dataset/font_img"],
+    help="Datasets paths, seperated by space (default: ['./dataset/font_img'])",
+)
 args = parser.parse_args()
 num_device = len(devices)
 data_module = FontDataModule(
+    train_paths=[os.path.join(path, "train") for path in args.datasets],
+    val_paths=[os.path.join(path, "val") for path in args.datasets],
+    test_paths=[os.path.join(path, "test") for path in args.datasets],
     batch_size=single_batch_size,
     num_workers=single_device_num_workers,
     pin_memory=True,