Spaces:

imdeadinside410
/

AIoT-llm2-syllabus

Sleeping

imdeadinside410 commited on May 23, 2024

Commit

7af778e

verified ·

1 Parent(s): 2ee03f4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -74,7 +74,7 @@ peft_model_id = "imdeadinside410/Llama2-Syllabus"
 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(
-    config.base_model_name_or_path, return_dict=True)
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
@@ -84,9 +84,7 @@ model = PeftModel.from_pretrained(model, peft_model_id)
 pipe = pipeline(task="text-generation",
                 model=model,
-                tokenizer=tokenizer,
-                device=-1,  # -1 indicates CPU
-                max_length=300)
@@ -158,14 +156,14 @@ def main():
     conversation = st.session_state.get("conversation", [])
     query = st.text_input("Please input your question here:", key="user_input")
-    result = pipe(f"<s>[INST] {query} [/INST]")
     if st.button("Get Answer"):
         if query:
             # Display the processing message
             with st.spinner("Processing your question..."):
                 conversation.append({"role": "user", "message": query})
                 # Call your QA function
-                answer = result
                 conversation.append({"role": "bot", "message": answer})
                 st.session_state.conversation = conversation
         else:

 config = PeftConfig.from_pretrained(peft_model_id)
 model = AutoModelForCausalLM.from_pretrained(
+    config.base_model_name_or_path, return_dict=True, load_in_4bit=True, device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
 pipe = pipeline(task="text-generation",
                 model=model,
+                tokenizer=tokenizer, max_length=300)
     conversation = st.session_state.get("conversation", [])
     query = st.text_input("Please input your question here:", key="user_input")
+    result = pipe(f"<s>[INST] {prompt} [/INST]")
     if st.button("Get Answer"):
         if query:
             # Display the processing message
             with st.spinner("Processing your question..."):
                 conversation.append({"role": "user", "message": query})
                 # Call your QA function
+                answer = result[0]['generated_text'].split("[/INST]")[1]
                 conversation.append({"role": "bot", "message": answer})
                 st.session_state.conversation = conversation
         else: