llmixer
/

ExllamaV2-Control-Vectors

@@ -78,7 +78,9 @@ class ExLlamaV2ModuleWrapper:
     def wrapped_forward(self, *args, **kwargs):
         x = self.module.forward(*args, **kwargs)
         try:
             x += self.control_vector[self.module.layer_idx].clone().to(x.device)
         except IndexError:
             pass
         return x

     def wrapped_forward(self, *args, **kwargs):
         x = self.module.forward(*args, **kwargs)
         try:
+            prev_norm = torch.norm(x, p=2)
             x += self.control_vector[self.module.layer_idx].clone().to(x.device)
+            x *= prev_norm / torch.norm(x, p=2)
         except IndexError:
             pass
         return x