Spaces:

Cognomen
/

CatCon-Controlnet-WD-1-5-b2

Runtime error

Cognomen commited on May 2, 2023

Commit

1da736d

1 Parent(s): f3148bf

do more of what canny_coyo1m does

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,6 @@
 import gradio as gr
-from diffusers import StableDiffusionControlNetPipeline, ControlNetModel
 from diffusers import UniPCMultistepScheduler
 import torch
 torch.backends.cuda.matmul.allow_tf32 = True
@@ -24,12 +25,12 @@ conditioning_image_transforms = T.Compose(
     ]
 )
-cnet = ControlNetModel.from_pretrained("./models/catcon-controlnet-wd", torch_dtype=torch.float16, from_flax=True).to("cuda")
-pipe = StableDiffusionControlNetPipeline.from_pretrained(
         "./models/wd-1-5-b2",
         controlnet=cnet,
-        torch_dtype=torch.float16,
-        ).to("cuda")
 pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
 #pipe.enable_model_cpu_offload()
 #pipe.enable_xformers_memory_efficient_attention()
@@ -41,15 +42,18 @@ def infer(prompt, negative_prompt, image):
     # implement your inference function here
     inp = Image.fromarray(image)
-    cond_input = conditioning_image_transforms(inp).to("cpu", dtype=torch.float32)
     cond_input = T.ToPILImage()(cond_input)
     output = pipe(
         prompt,
-        cond_input,
         generator=generator,
         num_images_per_prompt=4,
-        num_inference_steps=20
             )
     return output.images

 import gradio as gr
+import jax.numpy as jnp
+from diffusers import FlaxStableDiffusionControlNetPipeline, FlaxControlNetModel
 from diffusers import UniPCMultistepScheduler
 import torch
 torch.backends.cuda.matmul.allow_tf32 = True
     ]
 )
+cnet = FlaxControlNetModel.from_pretrained("./models/catcon-controlnet-wd", dtype=jnp.bfloat16, from_flax=True)
+pipe = FlaxStableDiffusionControlNetPipeline.from_pretrained(
         "./models/wd-1-5-b2",
         controlnet=cnet,
+        dtype=jnp.bfloat16,
+        )
 pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)
 #pipe.enable_model_cpu_offload()
 #pipe.enable_xformers_memory_efficient_attention()
     # implement your inference function here
     inp = Image.fromarray(image)
+    cond_input = conditioning_image_transforms(inp)
     cond_input = T.ToPILImage()(cond_input)
+    cond_in = pipe.prepare_image_inputs([cond_input] * 4)
     output = pipe(
         prompt,
+        cond_in,
         generator=generator,
         num_images_per_prompt=4,
+        num_inference_steps=20,
+        jit=True
             )
     return output.images