Spaces:

nyanko7
/

sd-diffusers-webui

Runtime error

App Files Files Community

nyanko7 commited on Jan 28, 2023

Commit

8902214

1 Parent(s): ebb4814

chore: sync with upstream

Browse files

Files changed (1) hide show

app.py +16 -25

app.py CHANGED Viewed

@@ -60,7 +60,7 @@ samplers_k_diffusion = [
 # ]
 start_time = time.time()
-timeout = 120
 scheduler = DDIMScheduler.from_pretrained(
     base_model,
@@ -151,6 +151,9 @@ def setup_model(name, lora_state=None, lora_scale=1.0):
         local_lora.to(local_unet.device, dtype=local_unet.dtype)
     pipe.setup_unet(local_unet)
     pipe.setup_text_encoder(clip_skip, local_te)
     return pipe
@@ -177,7 +180,7 @@ def make_token_names(embs):
         all_tokens.append(tokens)
     return all_tokens
-def setup_tokenizer(embs):
     reg_match = [re.compile(fr"(?:^|(?<=\s|,)){k}(?=,|\s|$)") for k in embs.keys()]
     clip_keywords = [' '.join(s) for s in make_token_names(embs)]
@@ -186,18 +189,13 @@ def setup_tokenizer(embs):
             prompt = m.sub(v, prompt)
         return prompt
-def restore_all():
-    global te_base_weight, tokenizer
-    tokenizer.prepare_for_tokenization = original_prepare_for_tokenization
-    embeddings = text_encoder.get_input_embeddings()
-    text_encoder.get_input_embeddings().weight.data = embeddings.weight.data[:te_base_weight_length]
-    tokenizer = CLIPTokenizer.from_pretrained(
-        base_model,
-        subfolder="tokenizer",
-        torch_dtype=torch.float16,
-    )
 def convert_size(size_bytes):
     if size_bytes == 0:
@@ -230,20 +228,19 @@ def inference(
     lora_state=None,
     lora_scale=None,
 ):
-    global pipe, unet, tokenizer, text_encoder
     if seed is None or seed == 0:
         seed = random.randint(0, 2147483647)
     start_time = time.time()
-    restore_all()
     generator = torch.Generator("cuda").manual_seed(int(seed))
-    setup_model(model, lora_state, lora_scale)
     sampler_name, sampler_opt = None, None
     for label, funcname, options in samplers_k_diffusion:
         if label == sampler:
             sampler_name, sampler_opt = funcname, options
     if embs is not None and len(embs) > 0:
         ti_embs = {}
         for name, file in embs.items():
@@ -255,13 +252,14 @@ def inference(
             ti_embs[name] = loaded_learned_embeds
         if len(ti_embs) > 0:
-            tokens = setup_tokenizer(ti_embs)
             added_tokens = tokenizer.add_tokens(tokens)
             delta_weight = torch.cat([val for val in ti_embs.values()], dim=0)
             assert added_tokens == delta_weight.shape[0]
             text_encoder.resize_token_embeddings(len(tokenizer))
-            text_encoder.get_input_embeddings().weight.data[-delta_weight.shape[0]:] = delta_weight
     config = {
         "negative_prompt": neg_prompt,
@@ -296,13 +294,6 @@ def inference(
     else:
         result = pipe.txt2img(prompt, width=width, height=height, **config)
-    # restore
-    if embs is not None and len(embs) > 0:
-        restore_all()
-    if model in [key[0] for key in alt_models]:
-        local_unet.to("cpu")
     end_time = time.time()
     vram_free, vram_total = torch.cuda.mem_get_info()
     print(f"done: model={model}, res={width}x{height}, step={steps}, time={round(end_time-start_time, 2)}s, vram_alloc={convert_size(vram_total-vram_free)}/{convert_size(vram_total)}")

 # ]
 start_time = time.time()
+timeout = 90
 scheduler = DDIMScheduler.from_pretrained(
     base_model,
         local_lora.to(local_unet.device, dtype=local_unet.dtype)
     pipe.setup_unet(local_unet)
+    pipe.tokenizer.prepare_for_tokenization = original_prepare_for_tokenization
+    pipe.tokenizer.added_tokens_encoder = {}
+    pipe.tokenizer.added_tokens_decoder = {}
     pipe.setup_text_encoder(clip_skip, local_te)
     return pipe
         all_tokens.append(tokens)
     return all_tokens
+def setup_tokenizer(tokenizer, embs):
     reg_match = [re.compile(fr"(?:^|(?<=\s|,)){k}(?=,|\s|$)") for k in embs.keys()]
     clip_keywords = [' '.join(s) for s in make_token_names(embs)]
             prompt = m.sub(v, prompt)
         return prompt
+    def prepare_for_tokenization(self, text: str, is_split_into_words: bool = False, **kwargs):
+        text = parse_prompt(text)
+        r = original_prepare_for_tokenization(text, is_split_into_words, **kwargs)
+        return r
+        tokenizer.prepare_for_tokenization = prepare_for_tokenization.__get__(tokenizer, CLIPTokenizer)
+    return [t for sublist in make_token_names(embs) for t in sublist]
 def convert_size(size_bytes):
     if size_bytes == 0:
     lora_state=None,
     lora_scale=None,
 ):
     if seed is None or seed == 0:
         seed = random.randint(0, 2147483647)
     start_time = time.time()
+    pipe = setup_model(model, lora_state, lora_scale)
     generator = torch.Generator("cuda").manual_seed(int(seed))
     sampler_name, sampler_opt = None, None
     for label, funcname, options in samplers_k_diffusion:
         if label == sampler:
             sampler_name, sampler_opt = funcname, options
+    tokenizer, text_encoder = pipe.tokenizer, pipe.text_encoder
     if embs is not None and len(embs) > 0:
         ti_embs = {}
         for name, file in embs.items():
             ti_embs[name] = loaded_learned_embeds
         if len(ti_embs) > 0:
+            tokens = setup_tokenizer(tokenizer, ti_embs)
             added_tokens = tokenizer.add_tokens(tokens)
             delta_weight = torch.cat([val for val in ti_embs.values()], dim=0)
             assert added_tokens == delta_weight.shape[0]
             text_encoder.resize_token_embeddings(len(tokenizer))
+            token_embeds = text_encoder.get_input_embeddings().weight.data
+            token_embeds[-delta_weight.shape[0]:] = delta_weight
     config = {
         "negative_prompt": neg_prompt,
     else:
         result = pipe.txt2img(prompt, width=width, height=height, **config)
     end_time = time.time()
     vram_free, vram_total = torch.cuda.mem_get_info()
     print(f"done: model={model}, res={width}x{height}, step={steps}, time={round(end_time-start_time, 2)}s, vram_alloc={convert_size(vram_total-vram_free)}/{convert_size(vram_total)}")