Spaces:

gupta1912
/

ERA-S12

Sleeping

App Files Files Community

gupta1912 commited on Aug 6, 2023

Commit

4937055

1 Parent(s): 29933c6

Upload 3 files

Browse files

Files changed (3) hide show

model.ckpt +3 -0
model.py +73 -0
utils.py +211 -0

model.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e0ae70f8bb67a7ab0e6336f4357de5795ce471083cb74ee1db05d4bf85a03719
+size 78956063

model.py ADDED Viewed

	@@ -0,0 +1,73 @@

+import torch.nn as nn
+import torch.nn.functional as F
+class ResBlock(nn.Module):
+    def __init__(self, in_channels, out_channels):
+        super(ResBlock, self).__init__()
+        self.convblock1 = nn.Sequential(
+            nn.Conv2d(in_channels, out_channels,kernel_size=(3,3), stride = 1, padding = 1,bias=False),
+            nn.BatchNorm2d(out_channels),
+            nn.ReLU(),
+            nn.Conv2d(out_channels, out_channels,kernel_size=(3,3), stride = 1, padding = 1,bias=False),
+            nn.BatchNorm2d(out_channels),
+            nn.ReLU()
+        )
+    def forward(self, x):
+        x = self.convblock1(x)
+        return x
+class MyResNet(nn.Module):
+    def __init__(self):
+        super(MyResNet,self).__init__()
+        self.prep_layer = nn.Sequential(
+        nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1,bias=True),
+        nn.BatchNorm2d(64),
+        nn.ReLU(),
+        )
+        self.layer1 = nn.Sequential(
+            nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1,bias=True),
+            nn.MaxPool2d(2,2),
+            nn.BatchNorm2d(128),
+            nn.ReLU(),
+        )
+        self.resblock1 = ResBlock(128, 128)
+        self.layer2 = nn.Sequential(
+            nn.Conv2d(128, 256, kernel_size=3, stride=1, padding=1,bias=True),
+            nn.MaxPool2d(kernel_size=2),
+            nn.BatchNorm2d(256),
+            nn.ReLU(),
+        )
+        self.layer3 = nn.Sequential(
+            nn.Conv2d(256, 512, kernel_size=3, stride=1, padding=1,bias=True),
+            nn.MaxPool2d(kernel_size=2),
+            nn.BatchNorm2d(512),
+            nn.ReLU(),
+        )
+        self.resblock2 = ResBlock(512, 512)
+        self.maxpool = nn.MaxPool2d(kernel_size=4)
+        self.fc = nn.Linear(512, 10)
+    def forward(self, x):
+        out = self.prep_layer(x)
+        out = self.layer1(out)
+        res1 = self.resblock1(out)
+        out = out + res1
+        out = self.layer2(out)
+        out = self.layer3(out)
+        res2 = self.resblock2(out)
+        out = out + res2
+        out = self.maxpool(out)
+        out = out.view(out.size(0), -1)
+        out = self.fc(out)
+        return F.log_softmax(out,dim = -1)

utils.py ADDED Viewed

	@@ -0,0 +1,211 @@

+# imports
+import albumentations as A
+import lightning as L
+import matplotlib.pyplot as plt
+import numpy as np
+import torch
+import torch.optim as optim
+from albumentations.pytorch import ToTensorV2
+from model import MyResNet
+from pytorch_grad_cam import GradCAM
+from pytorch_grad_cam.utils.image import preprocess_image, show_cam_on_image
+from torch import nn
+from torch.optim.lr_scheduler import OneCycleLR
+from torch.utils.data import DataLoader
+from torchmetrics.functional import accuracy
+from torchvision import datasets, transforms
+means = [0.4914, 0.4822, 0.4465]
+stds = [0.2470, 0.2435, 0.2616]
+class CustomResnetTransforms:
+    def train_transforms(means, stds):
+        return A.Compose(
+                [
+                    A.Normalize(mean=means, std=stds, always_apply=True),
+                    A.PadIfNeeded(min_height=36, min_width=36, always_apply=True),
+                    A.RandomCrop(height=32, width=32, always_apply=True),
+                    A.HorizontalFlip(),
+                    A.Cutout(num_holes=1, max_h_size=8, max_w_size=8, fill_value=0, p=1.0),
+                    ToTensorV2(),
+                ]
+            )
+    def test_transforms(means, stds):
+         return A.Compose(
+            [
+                A.Normalize(mean=means, std=stds, always_apply=True),
+                ToTensorV2(),
+            ]
+        )
+class Cifar10SearchDataset(datasets.CIFAR10):
+    def __init__(self, root="~/data", train=True, download=True, transform=None):
+        super().__init__(root=root, train=train, download=download, transform=transform)
+    def __getitem__(self, index):
+        image, label = self.data[index], self.targets[index]
+        if self.transform is not None:
+            transformed = self.transform(image=image)
+            image = transformed["image"]
+        return image, label
+class LitCIFAR10(L.LightningModule):
+    def __init__(self, data_dir='./data', learning_rate=0.01, batch_size = 512):
+        super().__init__()
+        # Set our init args as class attributes
+        self.data_dir = data_dir
+        self.lr = learning_rate
+        self.batch_size = batch_size
+        # Hardcode some dataset specific attributes
+        self.num_classes = 10
+        self.train_transforms = CustomResnetTransforms.train_transforms(means, stds)
+        self.test_transforms = CustomResnetTransforms.test_transforms(means, stds)
+        # Define PyTorch model
+        self.model = MyResNet()
+        self.criterion = nn.CrossEntropyLoss()
+    def forward(self, x):
+        return self.model(x)
+    def training_step(self, batch, batch_idx):
+        x, y = batch
+        logits = self(x)
+        loss = self.criterion(logits, y)
+        preds = torch.argmax(logits, dim=1)
+        acc = accuracy(preds, y, task='multiclass',
+                                     num_classes=10)
+        # Calling self.log will surface up scalars for you in TensorBoard
+        self.log("train_loss", loss, prog_bar=True, enable_graph = True, on_step=False, on_epoch=True)
+        self.log("train_acc", acc, prog_bar=True, enable_graph = True, on_step=False, on_epoch=True)
+        # print("train_loss", loss)
+        # print("train_acc", acc)
+        return loss
+    def validation_step(self, batch, batch_idx):
+        x, y = batch
+        logits = self(x)
+        loss = self.criterion(logits, y)
+        preds = torch.argmax(logits, dim=1)
+        acc = accuracy(preds, y, task='multiclass',
+                                     num_classes=10)
+        # Calling self.log will surface up scalars for you in TensorBoard
+        self.log("val_loss", loss, prog_bar=True, enable_graph = True, on_step=False, on_epoch=True)
+        self.log("val_acc", acc, prog_bar=True, enable_graph = True, on_step=False, on_epoch=True)
+        return loss
+    def configure_optimizers(self):
+        optimizer = optim.Adam(self.parameters(), lr=self.lr, weight_decay=1e-4)
+        steps_per_epoch = (len(self.trainset) // self.batch_size)+1
+        scheduler_dict = {
+            "scheduler": OneCycleLR(
+                                    optimizer,
+                                    max_lr = self.lr,
+                                    steps_per_epoch=steps_per_epoch,
+                                    epochs=self.trainer.max_epochs,
+                                    pct_start=5/self.trainer.max_epochs,
+                                    div_factor=100,
+                                    three_phase=False,
+                                    final_div_factor=100,
+                                    anneal_strategy='linear'
+                                ),
+            "interval": "step",
+        }
+        return {"optimizer": optimizer, "lr_scheduler": scheduler_dict}
+    def setup(self, stage=None):
+        # Assign train/val datasets for use in dataloaders
+        self.trainset = Cifar10SearchDataset(root=self.data_dir, train=True,
+                                    download=True, transform=self.train_transforms)
+        self.valset = Cifar10SearchDataset(root=self.data_dir, train=False,
+                                    download=True, transform=self.test_transforms)
+    def train_dataloader(self):
+        return DataLoader(self.trainset, batch_size=self.batch_size, num_workers=0, pin_memory=True)
+    def val_dataloader(self):
+        return DataLoader(self.valset, batch_size=self.batch_size, num_workers=0, pin_memory=True)
+def get_misclassified_images(model, testset, mu, sigma, device):
+    model.eval()
+    transform=transforms.Compose([
+                            transforms.ToTensor(),
+                            transforms.Normalize(mu, sigma)
+                        ])
+    misclassified_images, misclassified_predictions, true_targets = [], [], []
+    with torch.no_grad():
+        for data_, target in testset:
+            data = transform(data_).to(device)
+            data = data.unsqueeze(0)
+            output = model(data)
+            pred = output.argmax(dim=1, keepdim=True)
+            if pred.item()!=target:
+                misclassified_images.append(data_)
+                misclassified_predictions.append(pred.item())
+                true_targets.append(target)
+    return misclassified_images, misclassified_predictions, true_targets
+def plot_misclassified(image, pred, target, classes):
+    nrows = 4
+    ncols = 5
+    _, ax = plt.subplots(nrows, ncols, figsize=(20, 15))
+    for i in range(nrows):
+        for j in range(ncols):
+            index = i * ncols + j
+            ax[i, j].axis("off")
+            ax[i, j].set_title(f"Prediction: {classes[pred[index]]}\nTarget: {classes[target[index]]}")
+            ax[i, j].imshow(image[index])
+    plt.show()
+class ClassifierOutputTarget:
+    def __init__(self, category):
+        self.category = category
+    def __call__(self, model_output):
+        if len(model_output.shape) == 1:
+            return model_output[self.category]
+        return model_output[:, self.category]
+def plot_grad_cam_images(images, pred, target, classes, model):
+    nrows = 4
+    ncols = 5
+    fig, ax = plt.subplots(nrows, ncols, figsize=(20,15))
+    device = 'cuda' if torch.cuda.is_available() else 'cpu'
+    for i in range(nrows):
+        for j in range(ncols):
+            index = i * ncols + j
+            img = images[index]
+            input_tensor = preprocess_image(img,
+                                mean=[0.485, 0.456, 0.406],
+                                std=[0.229, 0.224, 0.225])
+            target_layers = [model.model.layer3[-1]]
+            targets = [ClassifierOutputTarget(target[index])]
+            cam = GradCAM(model=model, target_layers=target_layers, use_cuda = device)
+            grayscale_cam = cam(input_tensor=input_tensor, targets = targets)
+            #grayscale_cam = cam(input_tensor=input_tensor)
+            grayscale_cam = grayscale_cam[0, :]
+            rgb_img = np.float32(img) / 255
+            visualization = show_cam_on_image(rgb_img, grayscale_cam, use_rgb=True, image_weight = 0.6)
+            index = i * ncols + j
+            ax[i, j].axis("off")
+            ax[i, j].set_title(f"Prediction: {classes[pred[index]]}\nTarget: {classes[target[index]]}")
+            ax[i, j].imshow(visualization)
+    plt.show()