Spaces:

Dovakiins
/

qwerrwe

Build error

Nanobit commited on May 30, 2023

Commit

25eeeeb

1 Parent(s): cfcc549

Fix sharegpt prompt

Files changed (2) hide show

src/axolotl/prompt_tokenizers.py CHANGED Viewed

@@ -371,15 +371,16 @@ class ShareGPTPromptTokenizingStrategy(PromptTokenizingStrategy):
                             ]
                         # not masked out from labels
                         labels = copy.deepcopy(res["input_ids"])
                     else:
                         logging.warning(f"unhandled role: {part[0]}")
-                else:
-                    # this is only ever the first part, should include the bos token and the user query
-                    res = self._tokenize(
-                        part.strip(), add_eos_token=False, strip_bos_token=False
-                    )
-                    # everything from this is masked out from the labels
-                    labels = [IGNORE_TOKEN_ID] * len(res["input_ids"])
                 # pylint: disable=duplicate-code
                 result, current_len = parse_tokenized_to_result(

                             ]
                         # not masked out from labels
                         labels = copy.deepcopy(res["input_ids"])
+                    elif part[0] == "SYSTEM:":
+                        part = part[1]  # Ignore the system role from preamble
+                        # this is only ever the first part, should include the bos token and the user query
+                        res = self._tokenize(
+                            part.strip(), add_eos_token=False, strip_bos_token=False
+                        )
+                        # everything from this is masked out from the labels
+                        labels = [IGNORE_TOKEN_ID] * len(res["input_ids"])
                     else:
                         logging.warning(f"unhandled role: {part[0]}")
                 # pylint: disable=duplicate-code
                 result, current_len = parse_tokenized_to_result(

src/axolotl/prompters.py CHANGED Viewed

@@ -3,7 +3,7 @@
 import dataclasses
 import logging
 from enum import Enum, auto
-from typing import Generator, List, Optional, Union
 IGNORE_TOKEN_ID = -100
@@ -235,16 +235,16 @@ class Conversation:
     sep: str = "###"
     sep2: Optional[str] = None
-    def get_prompt(self) -> Generator[str, None, None]:
         # seps = [self.sep, self.sep2]
         preamble = self.system + self.sep
-        yield preamble
         for _, (role, message) in enumerate(self.messages):
             if message:
-                yield role + ":" + " " + message
             else:
                 logging.warning(f"role with empty message: {role}")
-                yield role + ":"
     def copy(self):
         return Conversation(

 import dataclasses
 import logging
 from enum import Enum, auto
+from typing import Generator, List, Optional, Tuple, Union
 IGNORE_TOKEN_ID = -100
     sep: str = "###"
     sep2: Optional[str] = None
+    def get_prompt(self) -> Generator[Tuple[str, str], None, None]:
         # seps = [self.sep, self.sep2]
         preamble = self.system + self.sep
+        yield ("SYSTEM:", preamble)
         for _, (role, message) in enumerate(self.messages):
             if message:
+                yield (role + ":", " " + message)
             else:
                 logging.warning(f"role with empty message: {role}")
+                yield (role + ":", "")
     def copy(self):
         return Conversation(