Spaces:

hsb06
/

chat-bot

Sleeping

App Files Files Community

Haseeb javed commited on Dec 22, 2024

Commit

db9fe30

1 Parent(s): a996985

runtime error fixes

Browse files

Files changed (1) hide show

app.py +22 -23

app.py CHANGED Viewed

@@ -5,45 +5,44 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 import logging
 import os
-MIN_TRANSFORMERS_VERSION = '4.25.1'
-# Check transformers version
-import transformers
-assert transformers.__version__ >= MIN_TRANSFORMERS_VERSION, f'Please upgrade transformers to version {MIN_TRANSFORMERS_VERSION} or higher.'
-# Initialize tokenizer and model from local directory
-model_dir = "hsb06/toghetherAi-model"
-tokenizer = AutoTokenizer.from_pretrained(model_dir)
-model = AutoModelForCausalLM.from_pretrained(model_dir, torch_dtype=torch.bfloat16)
 app = Flask(__name__)
-CORS(app)  # Enable CORS
-logging.basicConfig(level=logging.DEBUG)
 def generate_response(prompt):
-    inputs = tokenizer(prompt, return_tensors='pt').to(model.device)
     input_length = inputs.input_ids.shape[1]
     outputs = model.generate(
-        **inputs, max_new_tokens=128, do_sample=True, temperature=0.7, top_p=0.7, top_k=50, return_dict_in_generate=True
     )
     token = outputs.sequences[0, input_length:]
-    output_str = tokenizer.decode(token, skip_special_tokens=True)
-    return output_str
-@app.route('/chat', methods=['POST'])
 def chat():
-    logging.debug("Received a POST request")
     data = request.json
-    logging.debug(f"Request data: {data}")
     user_input = data.get("message", "")
     prompt = f"<human>: {user_input}\n<bot>:"
     response = generate_response(prompt)
-    logging.debug(f"Generated response: {response}")
     return jsonify({"response": response})
 if __name__ == "__main__":
-    # Get the port from environment variable or default to 5000
-    port = int(os.getenv("PORT", 5000))
     logging.info(f"Starting Flask app on port {port}")
-    app.run(debug=True, host="0.0.0.0", port=port)

 import logging
 import os
+# Initialize logger
+logging.basicConfig(level=logging.DEBUG)
+# Load tokenizer and model
+logging.info("Loading model...")
+model_repo = "hsb06/toghetherAi-model"
+tokenizer = AutoTokenizer.from_pretrained(model_repo, use_auth_token=True)
+model = AutoModelForCausalLM.from_pretrained(model_repo, torch_dtype=torch.float16, use_auth_token=True).to("cuda" if torch.cuda.is_available() else "cpu")
+logging.info("Model loaded successfully.")
+# Initialize Flask app
 app = Flask(__name__)
+CORS(app)
 def generate_response(prompt):
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     input_length = inputs.input_ids.shape[1]
     outputs = model.generate(
+        **inputs,
+        max_new_tokens=128,
+        do_sample=True,
+        temperature=0.7,
+        top_p=0.7,
+        top_k=50,
+        return_dict_in_generate=True,
     )
     token = outputs.sequences[0, input_length:]
+    return tokenizer.decode(token, skip_special_tokens=True)
+@app.route("/chat", methods=["POST"])
 def chat():
     data = request.json
     user_input = data.get("message", "")
     prompt = f"<human>: {user_input}\n<bot>:"
     response = generate_response(prompt)
     return jsonify({"response": response})
 if __name__ == "__main__":
+    port = int(os.getenv("PORT", 7860))  # Default to 7860
     logging.info(f"Starting Flask app on port {port}")
+    app.run(debug=False, host="0.0.0.0", port=port)