Spaces:

Dovakiins
/

qwerrwe

Build error

winglian commited on Aug 15, 2023

Commit

1687be6

unverified ·

1 Parent(s): 41ecb45

don't use mask expansion for inference (#392)

Files changed (3) hide show

examples/llama-2/lora.yml CHANGED Viewed

@@ -2,6 +2,7 @@ base_model: meta-llama/Llama-2-7b-hf
 base_model_config: meta-llama/Llama-2-7b-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
 load_in_8bit: true
 load_in_4bit: false

 base_model_config: meta-llama/Llama-2-7b-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
+is_llama_derived_model: true
 load_in_8bit: true
 load_in_4bit: false

examples/llama-2/qlora.yml CHANGED Viewed

@@ -2,6 +2,7 @@ base_model: meta-llama/Llama-2-7b-hf
 base_model_config: meta-llama/Llama-2-7b-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
 load_in_8bit: false
 load_in_4bit: true

 base_model_config: meta-llama/Llama-2-7b-hf
 model_type: LlamaForCausalLM
 tokenizer_type: LlamaTokenizer
+is_llama_derived_model: true
 load_in_8bit: false
 load_in_4bit: true

src/axolotl/utils/models.py CHANGED Viewed

@@ -138,8 +138,10 @@ def load_model(
         LOG.info("patching with xpos rope")
         replace_llama_rope_with_xpos_rope()
-    if cfg.is_llama_derived_model and (
-        cfg.max_packed_sequence_len or cfg.sample_packing
     ):
         from axolotl.monkeypatch.llama_expand_mask import hijack_expand_mask

         LOG.info("patching with xpos rope")
         replace_llama_rope_with_xpos_rope()
+    if (
+        cfg.is_llama_derived_model
+        and (cfg.max_packed_sequence_len or cfg.sample_packing)
+        and not cfg.inference
     ):
         from axolotl.monkeypatch.llama_expand_mask import hijack_expand_mask