Spaces:

rivapereira123
/

firstaid

Sleeping

rivapereira123 commited on Jul 13

Commit

67b8dd4

verified ·

1 Parent(s): 53082ed

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -710,24 +710,18 @@ Provide clear, actionable advice while emphasizing the need for professional med
     def _generate_response(self, query: str, context: str) -> str:
-    """Enhanced response generation using model.generate() to avoid DynamicCache errors"""
-    if self.llm is None or self.tokenizer is None:
-        return self._generate_fallback_response(query, context)
-    prompt = f"""{self.system_prompt}
-MEDICAL KNOWLEDGE CONTEXT:
-{context}
-PATIENT QUESTION: {query}
-RESPONSE (provide practical, Gaza-appropriate medical guidance):"""
-    try:
-        # Tokenize input and move to correct device
-        inputs = self.tokenizer(prompt, return_tensors="pt").to(self.llm.device)
-        # Generate output
         outputs = self.llm.generate(
             **inputs,
             max_new_tokens=800,

     def _generate_response(self, query: str, context: str) -> str:
+        """Enhanced response generation using model.generate() to avoid DynamicCache errors"""
+        if self.llm is None or self.tokenizer is None:
+            return self._generate_fallback_response(query, context)
+            prompt = f"""{self.system_prompt}
+            MEDICAL KNOWLEDGE CONTEXT:
+            {context}
+            PATIENT QUESTION: {query}
+            RESPONSE (provide practical, Gaza-appropriate medical guidance):"""
+        try:
+            inputs = self.tokenizer(prompt, return_tensors="pt").to(self.llm.device)
         outputs = self.llm.generate(
             **inputs,
             max_new_tokens=800,