Spaces:

rayymaxx
/

DirectEd-AI-LoRA-API

Sleeping

rayymaxx commited on Aug 23

Commit

cce707f

1 Parent(s): d89fa1f

Add application file

Files changed (3) hide show

Dockerfile ADDED Viewed

+# Use Python 3.12
+FROM python:3.12-slim
+# Set working directory
+WORKDIR /app
+# Copy files
+COPY . .
+# Install dependencies
+RUN pip install --upgrade pip
+RUN pip install -r requirements.txt
+# Expose FastAPI port
+EXPOSE 7860
+# Run FastAPI
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

+from fastapi import FastAPI
+from pydantic import BaseModel
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+from peft import PeftModel
+# --- Config ---
+BASE_MODEL = "unsloth/llama-3-8b-Instruct-bnb-4bit"
+FINETUNED_ADAPTER = "rayymaxx/DirectEd-AI-LoRA"
+MAX_NEW_TOKENS = 200
+app = FastAPI(title="Directed AI FastAPI")
+# --- Load model & tokenizer once at startup ---
+tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+base_model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map="auto")
+model = PeftModel.from_pretrained(base_model, FINETUNED_ADAPTER)
+text_generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device_map="auto")
+class Prompt(BaseModel):
+    prompt: str
+@app.post("/generate")
+def generate_text(prompt_data: Prompt):
+    prompt_text = prompt_data.prompt
+    output = text_generator(prompt_text, max_new_tokens=MAX_NEW_TOKENS, do_sample=True, temperature=0.7)
+    return {"response": output[0]["generated_text"]}
+@app.get("/")
+def greet_json():
+    return {"Hello": "World!"}

requirements.txt ADDED Viewed

+fastapi
+uvicorn
+transformers>=4.35.0
+torch
+peft
+trl