Spaces:

Maximofn
/

SmolLM2_backend

Sleeping

App Files Files Community

Maximofn commited on 23 days ago

Commit

f00a406

1 Parent(s): 4e00035

FIrst commit

Browse files

Files changed (5) hide show

.gitignore +44 -0
Dockerfile +12 -0
README.md +82 -1
app.py +85 -0
requirements.txt +10 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,44 @@

+# Archivos de entorno
+.env
+.env.*
+# Archivos de Python
+__pycache__/
+*.py[cod]
+*$py.class
+*.so
+.Python
+env/
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+*.egg-info/
+.installed.cfg
+*.egg
+# Directorios virtuales
+venv/
+ENV/
+env/
+# Archivos de IDE
+.idea/
+.vscode/
+*.swp
+*.swo
+# Logs
+*.log
+logs/
+# Archivos temporales
+.DS_Store
+Thumbs.db

Dockerfile ADDED Viewed

	@@ -0,0 +1,12 @@

+FROM python:3.9-slim
+WORKDIR /app
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+COPY . .
+EXPOSE 8000
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]

README.md CHANGED Viewed

@@ -9,4 +9,85 @@ license: apache-2.0
 short_description: Backend of SmolLM2 chat
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 short_description: Backend of SmolLM2 chat
 ---
+# SmolLM2 Backend
+Este proyecto implementa una API con FastAPI que utiliza LangChain y LangGraph para generar texto con el modelo Qwen2.5-72B-Instruct de HuggingFace.
+## Configuración
+### En HuggingFace Spaces
+Este proyecto está diseñado para ejecutarse en HuggingFace Spaces. Para configurarlo:
+1. Crea un nuevo Space en HuggingFace con SDK Docker
+2. Configura la variable de entorno `HUGGINGFACE_TOKEN` o `HF_TOKEN` en la configuración del Space:
+   - Ve a la pestaña "Settings" de tu Space
+   - Desplázate hasta la sección "Repository secrets"
+   - Agrega una nueva variable con el nombre `HUGGINGFACE_TOKEN` y tu token como valor
+   - Guarda los cambios
+### Desarrollo local
+Para desarrollo local:
+1. Clona este repositorio
+2. Crea un archivo `.env` en la raíz del proyecto con tu token de HuggingFace:
+   ```
+   HUGGINGFACE_TOKEN=tu_token_aqui
+   ```
+3. Instala las dependencias:
+   ```
+   pip install -r requirements.txt
+   ```
+## Ejecución local
+```bash
+uvicorn app:app --reload
+```
+La API estará disponible en `http://localhost:8000`.
+## Endpoints
+### GET /
+Endpoint de bienvenida que devuelve un mensaje de saludo.
+### POST /generate
+Endpoint para generar texto usando el modelo de lenguaje.
+**Parámetros de la solicitud:**
+```json
+{
+  "query": "Tu pregunta aquí",
+  "thread_id": "identificador_opcional_del_hilo"
+}
+```
+**Respuesta:**
+```json
+{
+  "generated_text": "Texto generado por el modelo",
+  "thread_id": "identificador_del_hilo"
+}
+```
+## Docker
+Para ejecutar la aplicación en un contenedor Docker:
+```bash
+# Construir la imagen
+docker build -t smollm2-backend .
+# Ejecutar el contenedor
+docker run -p 8000:8000 --env-file .env smollm2-backend
+```
+## Documentación de la API
+La documentación interactiva de la API está disponible en:
+- Swagger UI: `http://localhost:8000/docs`
+- ReDoc: `http://localhost:8000/redoc`

app.py ADDED Viewed

	@@ -0,0 +1,85 @@

+import os
+from typing import Dict, Any, List
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from dotenv import load_dotenv
+from langchain_huggingface import HuggingFaceEndpoint
+from langchain_core.messages import HumanMessage
+from langgraph.checkpoint.memory import MemorySaver
+from langgraph.graph import START, MessagesState, StateGraph
+# Cargar variables de entorno (útil para desarrollo local)
+load_dotenv()
+# Obtener token de HuggingFace
+# En HuggingFace Spaces, el token estará disponible como variable de entorno
+HUGGINGFACE_TOKEN = os.getenv("HUGGINGFACE_TOKEN") or os.getenv("HF_TOKEN")
+if not HUGGINGFACE_TOKEN:
+    raise ValueError("No se encontró la variable de entorno HUGGINGFACE_TOKEN o HF_TOKEN")
+# Inicializar el modelo
+model = HuggingFaceEndpoint(
+    model="Qwen/Qwen2.5-72B-Instruct",
+    huggingfacehub_api_token=HUGGINGFACE_TOKEN,
+    max_new_tokens=64,
+    temperature=0.5,
+    top_p=0.7,
+)
+# Definir el grafo
+workflow = StateGraph(state_schema=MessagesState)
+# Definir la función que llama al modelo
+def call_model(state: MessagesState):
+    response = model.invoke(state["messages"])
+    return {"messages": response}
+# Definir el nodo en el grafo
+workflow.add_edge(START, "model")
+workflow.add_node("model", call_model)
+# Agregar memoria
+memory = MemorySaver()
+graph_app = workflow.compile(checkpointer=memory)
+# Definir el modelo de datos para la solicitud
+class QueryRequest(BaseModel):
+    query: str
+    thread_id: str = "default"
+# Crear la aplicación FastAPI
+app = FastAPI(title="LangChain FastAPI", description="API para generar texto usando LangChain y LangGraph")
+@app.get("/")
+async def root():
+    """Endpoint de bienvenida"""
+    return {"detail": "Welcome to FastAPI, Langchain, Docker tutorial"}
+@app.post("/generate")
+async def generate(request: QueryRequest):
+    """Endpoint para generar texto usando el modelo de lenguaje"""
+    try:
+        # Configurar el ID del hilo
+        config = {"configurable": {"thread_id": request.thread_id}}
+        # Crear el mensaje de entrada
+        input_messages = [HumanMessage(content=request.query)]
+        # Invocar el grafo
+        output = graph_app.invoke({"messages": input_messages}, config)
+        # Obtener la respuesta del modelo
+        response = output["messages"][-1].content
+        return {
+            "generated_text": response,
+            "thread_id": request.thread_id
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error al generar texto: {str(e)}")
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=8000)

requirements.txt ADDED Viewed

	@@ -0,0 +1,10 @@

+fastapi==0.99.1
+uvicorn
+requests
+pydantic==1.10.12
+langchain
+langchain-huggingface
+langgraph
+python-dotenv
+clarifai
+Pillow