Spaces:

gparmar
/

img2img-turbo-sketch

Runtime error

App Files Files Community

gaparmar commited on Mar 19, 2024

Commit

a5f38fd

1 Parent(s): 13ed5cd

gamma

Browse files

Files changed (3) hide show

app.py +1 -1
src/model.py +46 -1
src/pix2pix_turbo.py +3 -46

app.py CHANGED Viewed

@@ -238,7 +238,7 @@ with gr.Blocks(css="style.css") as demo:
                 prompt_temp = gr.Textbox(label="Prompt Style Template", value=styles[DEFAULT_STYLE_NAME], scale=2, max_lines=1)
             with gr.Row():
-                val_r = gr.Slider(label="sketch guidance r: ", show_label=True, minimum=0, maximum=1, value=0.4, step=0.01, scale=3)
                 seed = gr.Textbox(label="Seed", value=42, scale=1, min_width=50)
                 randomize_seed = gr.Button("Random", scale=1, min_width=50)

                 prompt_temp = gr.Textbox(label="Prompt Style Template", value=styles[DEFAULT_STYLE_NAME], scale=2, max_lines=1)
             with gr.Row():
+                val_r = gr.Slider(label="Sketch guidance gamma: ", show_label=True, minimum=0, maximum=1, value=0.4, step=0.01, scale=3)
                 seed = gr.Textbox(label="Seed", value=42, scale=1, min_width=50)
                 randomize_seed = gr.Button("Random", scale=1, min_width=50)

src/model.py CHANGED Viewed

@@ -10,4 +10,49 @@ def make_1step_sched():
     noise_scheduler_1step = DDPMScheduler.from_pretrained("stabilityai/sd-turbo", subfolder="scheduler")
     noise_scheduler_1step.set_timesteps(1, device="cuda")
     noise_scheduler_1step.alphas_cumprod = noise_scheduler_1step.alphas_cumprod.cuda()
-    return noise_scheduler_1step

     noise_scheduler_1step = DDPMScheduler.from_pretrained("stabilityai/sd-turbo", subfolder="scheduler")
     noise_scheduler_1step.set_timesteps(1, device="cuda")
     noise_scheduler_1step.alphas_cumprod = noise_scheduler_1step.alphas_cumprod.cuda()
+    return noise_scheduler_1step
+"""The forward method of the `Encoder` class."""
+def my_vae_encoder_fwd(self, sample):
+    sample = self.conv_in(sample)
+    l_blocks = []
+    # down
+    for down_block in self.down_blocks:
+        l_blocks.append(sample)
+        sample = down_block(sample)
+    # middle
+    sample = self.mid_block(sample)
+    sample = self.conv_norm_out(sample)
+    sample = self.conv_act(sample)
+    sample = self.conv_out(sample)
+    self.current_down_blocks = l_blocks
+    return sample
+"""The forward method of the `Decoder` class."""
+def my_vae_decoder_fwd(self,sample, latent_embeds = None):
+    sample = self.conv_in(sample)
+    upscale_dtype = next(iter(self.up_blocks.parameters())).dtype
+    # middle
+    sample = self.mid_block(sample, latent_embeds)
+    sample = sample.to(upscale_dtype)
+    if not self.ignore_skip:
+        skip_convs = [self.skip_conv_1, self.skip_conv_2, self.skip_conv_3, self.skip_conv_4]
+        # up
+        for idx, up_block in enumerate(self.up_blocks):
+            skip_in = skip_convs[idx](self.incoming_skip_acts[::-1][idx] * self.gamma)
+            # add skip
+            sample = sample + skip_in
+            sample = up_block(sample, latent_embeds)
+    else:
+        for idx, up_block in enumerate(self.up_blocks):
+            sample = up_block(sample, latent_embeds)
+    # post-process
+    if latent_embeds is None:
+        sample = self.conv_norm_out(sample)
+    else:
+        sample = self.conv_norm_out(sample, latent_embeds)
+    sample = self.conv_act(sample)
+    sample = self.conv_out(sample)
+    return sample

src/pix2pix_turbo.py CHANGED Viewed

@@ -11,52 +11,7 @@ from diffusers.utils.peft_utils import set_weights_and_activate_adapters
 from peft import LoraConfig
 p = "src/"
 sys.path.append(p)
-from model import make_1step_sched
-"""The forward method of the `Encoder` class."""
-def my_vae_encoder_fwd(self, sample):
-    sample = self.conv_in(sample)
-    l_blocks = []
-    # down
-    for down_block in self.down_blocks:
-        l_blocks.append(sample)
-        sample = down_block(sample)
-    # middle
-    sample = self.mid_block(sample)
-    sample = self.conv_norm_out(sample)
-    sample = self.conv_act(sample)
-    sample = self.conv_out(sample)
-    self.current_down_blocks = l_blocks
-    return sample
-"""The forward method of the `Decoder` class."""
-def my_vae_decoder_fwd(self,sample, latent_embeds = None):
-    sample = self.conv_in(sample)
-    upscale_dtype = next(iter(self.up_blocks.parameters())).dtype
-    # middle
-    sample = self.mid_block(sample, latent_embeds)
-    sample = sample.to(upscale_dtype)
-    if not self.ignore_skip:
-        skip_convs = [self.skip_conv_1, self.skip_conv_2, self.skip_conv_3, self.skip_conv_4]
-        # up
-        for idx, up_block in enumerate(self.up_blocks):
-            skip_in = skip_convs[idx](self.incoming_skip_acts[::-1][idx])
-            # add skip
-            sample = sample + skip_in
-            sample = up_block(sample, latent_embeds)
-    else:
-        for idx, up_block in enumerate(self.up_blocks):
-            sample = up_block(sample, latent_embeds)
-    # post-process
-    if latent_embeds is None:
-        sample = self.conv_norm_out(sample)
-    else:
-        sample = self.conv_norm_out(sample, latent_embeds)
-    sample = self.conv_act(sample)
-    sample = self.conv_out(sample)
-    return sample
 class TwinConv(torch.nn.Module):
@@ -151,6 +106,7 @@ class Pix2Pix_Turbo(torch.nn.Module):
         unet.eval()
         vae.eval()
         self.unet, self.vae = unet, vae
         self.timesteps = torch.tensor([999], device="cuda").long()
@@ -177,5 +133,6 @@ class Pix2Pix_Turbo(torch.nn.Module):
             self.unet.conv_in.r = None
             x_denoised = self.sched.step(unet_output, self.timesteps, unet_input, return_dict=True).prev_sample
             self.vae.decoder.incoming_skip_acts = self.vae.encoder.current_down_blocks
             output_image = (self.vae.decode(x_denoised / self.vae.config.scaling_factor ).sample).clamp(-1,1)
         return output_image

 from peft import LoraConfig
 p = "src/"
 sys.path.append(p)
+from model import make_1step_sched, my_vae_encoder_fwd, my_vae_decoder_fwd
 class TwinConv(torch.nn.Module):
         unet.eval()
         vae.eval()
         self.unet, self.vae = unet, vae
+        self.vae.decoder.gamma = 1
         self.timesteps = torch.tensor([999], device="cuda").long()
             self.unet.conv_in.r = None
             x_denoised = self.sched.step(unet_output, self.timesteps, unet_input, return_dict=True).prev_sample
             self.vae.decoder.incoming_skip_acts = self.vae.encoder.current_down_blocks
+            self.vae.decoder.gamma = r
             output_image = (self.vae.decode(x_denoised / self.vae.config.scaling_factor ).sample).clamp(-1,1)
         return output_image