toxic-comment-classifier_rlhf

Paused

App Files Files Community

JanviMl commited on Apr 19

Commit

986acc0

verified ·

1 Parent(s): ac0ca8d

Update model_loader.py

Browse files

Files changed (1) hide show

model_loader.py +45 -19

model_loader.py CHANGED Viewed

@@ -1,54 +1,80 @@
 # model_loader.py
 from transformers import AutoModelForSequenceClassification, AutoTokenizer, AutoModelForCausalLM
 from sentence_transformers import SentenceTransformer
-# Classifier Model (XLM-RoBERTa for toxicity classification)
 class ClassifierModel:
     def __init__(self):
         self.model = None
         self.tokenizer = None
-        self.load_model()
-    def load_model(self):
         """
-        Load the fine-tuned XLM-RoBERTa model and tokenizer for toxic comment classification.
         """
         try:
             model_name = "JanviMl/xlm-roberta-toxic-classifier-capstone"
             self.model = AutoModelForSequenceClassification.from_pretrained(model_name)
-            self.tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False)
         except Exception as e:
-            raise Exception(f"Error loading classifier model or tokenizer: {str(e)}")
-# Paraphraser Model (Granite 3.2-2B-Instruct for paraphrasing)
 class ParaphraserModel:
     def __init__(self):
         self.model = None
         self.tokenizer = None
-        self.load_model()
-    def load_model(self):
         """
-        Load the Granite 3.2-2B-Instruct model and tokenizer for paraphrasing.
         """
         try:
             model_name = "ibm-granite/granite-3.2-2b-instruct"
             self.model = AutoModelForCausalLM.from_pretrained(model_name)
             self.tokenizer = AutoTokenizer.from_pretrained(model_name)
         except Exception as e:
-            raise Exception(f"Error loading paraphrase model or tokenizer: {str(e)}")
-# Metrics Models (Sentence-BERT only)
 class MetricsModels:
     def __init__(self):
-        self.sentence_bert_model = None
     def load_sentence_bert(self):
-        if self.sentence_bert_model is None:
-            self.sentence_bert_model = SentenceTransformer('all-MiniLM-L6-v2')
-        return self.sentence_bert_model
-# Singleton instances
-classifier_model = ClassifierModel()
-paraphraser_model = ParaphraserModel()
 metrics_models = MetricsModels()

 # model_loader.py
 from transformers import AutoModelForSequenceClassification, AutoTokenizer, AutoModelForCausalLM
 from sentence_transformers import SentenceTransformer
+import torch
+import os
 class ClassifierModel:
     def __init__(self):
         self.model = None
         self.tokenizer = None
+        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+        self.load_classifier_model()
+    def load_classifier_model(self):
         """
+        Load the fine-tuned XLM-RoBERTa model and tokenizer for toxicity classification.
         """
         try:
             model_name = "JanviMl/xlm-roberta-toxic-classifier-capstone"
+            print(f"Loading classifier model: {model_name}")
             self.model = AutoModelForSequenceClassification.from_pretrained(model_name)
+            self.tokenizer = AutoTokenizer.from_pretrained(model_name)
+            self.model.to(self.device)
+            self.model.eval()
+            print("Classifier model loaded successfully")
         except Exception as e:
+            print(f"Error loading classifier model: {str(e)}")
+            raise
+classifier_model = ClassifierModel()
 class ParaphraserModel:
     def __init__(self):
         self.model = None
         self.tokenizer = None
+        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+        self.load_paraphraser_model()
+    def load_paraphraser_model(self):
         """
+        Load the fine-tuned Granite 3.2-2B-Instruct model and tokenizer for paraphrasing.
         """
         try:
             model_name = "ibm-granite/granite-3.2-2b-instruct"
+            print(f"Loading paraphraser model: {model_name}")
             self.model = AutoModelForCausalLM.from_pretrained(model_name)
             self.tokenizer = AutoTokenizer.from_pretrained(model_name)
+            # Set a distinct pad token to avoid conflict with eos token
+            if self.tokenizer.pad_token is None or self.tokenizer.pad_token == self.tokenizer.eos_token:
+                self.tokenizer.pad_token = "<pad>"
+                self.model.config.pad_token_id = self.tokenizer.convert_tokens_to_ids("<pad>")
+            self.model.to(self.device)
+            self.model.eval()
+            print("Paraphraser model loaded successfully")
         except Exception as e:
+            print(f"Error loading paraphraser model: {str(e)}")
+            raise
+paraphraser_model = ParaphraserModel()
 class MetricsModels:
     def __init__(self):
+        self.sentence_bert = None
+        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+        self.load_sentence_bert()
     def load_sentence_bert(self):
+        """
+        Load the Sentence-BERT model for computing semantic similarity.
+        """
+        try:
+            model_name = "sentence-transformers/all-MiniLM-L6-v2"
+            print(f"Loading Sentence-BERT model: {model_name}")
+            self.sentence_bert = SentenceTransformer(model_name, device=self.device)
+            print("Sentence-BERT model loaded successfully")
+        except Exception as e:
+            print(f"Error loading Sentence-BERT model: {str(e)}")
+            raise
 metrics_models = MetricsModels()