AlberBshara
/

ar_llama3.1

Question Answering

Supporting Arabic Language

Inference Endpoints

Model card Files Files and versions Community

AlberBshara commited on Sep 9, 2024

Commit

3ec423c

·

verified ·

1 Parent(s): 9a9fa47

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -282,9 +282,9 @@ class LLM:
               add_generation_prompt=True, # Must add for generation
               return_tensors="pt",
         ).to("cuda")
         # Increase the max_new_tokens to allow more detailed responses
-        output_ids = self.model.generate(inputs, max_new_tokens=self.max_new_tokens, pad_token_id=self._EOS_TOKEN_ID)
         output_ids = output_ids.tolist()[0] if output_ids.size(0) == 1 else output_ids.tolist()
         output_text = self.__tokenizer.decode(output_ids, skip_special_tokens=True)
@@ -320,4 +320,7 @@ class LLM:
             },
             "methods": ["invoke", "extract_answer"]
         }
 ```

               add_generation_prompt=True, # Must add for generation
               return_tensors="pt",
         ).to("cuda")
         # Increase the max_new_tokens to allow more detailed responses
+        output_ids = self.model.generate(inputs, max_new_tokens=self.max_new_tokens, pad_token_id=self.__tokenizer.pad_token_id)
         output_ids = output_ids.tolist()[0] if output_ids.size(0) == 1 else output_ids.tolist()
         output_text = self.__tokenizer.decode(output_ids, skip_special_tokens=True)
             },
             "methods": ["invoke", "extract_answer"]
         }
+llm = LLM()
 ```