AI

Running

App Files Files Community

AI / main.py

MatteoScript

Update main.py

ae6b74a verified 6 days ago

raw

history blame

9.57 kB

	import os
	import time
	import random
	import asyncio
	import json
	from fastapi import FastAPI, HTTPException, Depends
	from fastapi.middleware.cors import CORSMiddleware
	from fastapi.security.api_key import APIKeyHeader
	from pydantic import BaseModel
	from typing import List, Optional
	from dotenv import load_dotenv
	from starlette.responses import StreamingResponse
	from openai import OpenAI
	from typing import List, Optional, Dict, Any
	import copy

	load_dotenv()

	BASE_URL = "https://generativelanguage.googleapis.com/v1beta/openai/"
	EXPECTED_API_KEY = os.getenv("API_HUGGINGFACE")
	API_KEY_NAME = "Authorization"
	API_KEYS = [
	os.getenv("API_GEMINI_1"),
	os.getenv("API_GEMINI_2"),
	os.getenv("API_GEMINI_3"),
	os.getenv("API_GEMINI_4"),
	os.getenv("API_GEMINI_5"),
	]

	# Classi Pydantic di VALIDAZIONE Body
	class ChatCompletionRequest(BaseModel):
	model: str = "gemini-2.0-flash"
	messages: Optional[Any]
	max_tokens: Optional[int] = 8196
	temperature: Optional[float] = 0.8
	stream: Optional[bool] = False
	stream_options: Optional[Dict[str, Any]] = None
	class Config:
	extra = "allow"

	# Server FAST API
	app = FastAPI(title="OpenAI-SDK-compatible API", version="1.0.0", description="Un wrapper FastAPI compatibile con le specifiche dell'API OpenAI.")
	app.add_middleware(
	CORSMiddleware,
	allow_origins=["*"],
	allow_credentials=True,
	allow_methods=["*"],
	allow_headers=["*"],
	)

	# Client OpenAI
	def get_openai_client():
	''' Client OpenAI passando in modo RANDOM le Chiavi API. In questo modo posso aggirare i limiti "Quota Exceeded" '''
	api_key = random.choice(API_KEYS)
	return OpenAI(api_key=api_key, base_url=BASE_URL)

	# Validazione API
	api_key_header = APIKeyHeader(name=API_KEY_NAME, auto_error=False)
	def verify_api_key(api_key: str = Depends(api_key_header)):
	''' Validazione Chiave API - Per ora in ENV, Token HF '''
	if not api_key:
	raise HTTPException(status_code=403, detail="API key mancante")
	if api_key != f"Bearer {EXPECTED_API_KEY}":
	raise HTTPException(status_code=403, detail="API key non valida")
	return api_key

	# Correzione payload con content=None
	def sanitize_messages(messages):
	"""Convert None content to empty string to avoid Gemini API errors"""
	if not messages:
	return messages
	for message in messages:
	if message.get('content') is None:
	message['content'] = " "
	return messages

	# Funzione per conversione Payload OpenAI to GEMINI (anomalia per ACTION) AnyOf, e property: {}
	def convert_openai_schema_for_gemini(tools_schema):
	if isinstance(tools_schema, str):
	try:
	tools_schema = json.loads(tools_schema)
	except json.JSONDecodeError:
	raise ValueError("Stringa JSON non valida fornita")
	converted_schema = []
	for tool in tools_schema:
	if tool.get("type") != "function":
	converted_schema.append(tool)
	continue
	converted_tool = {"type": "function", "function": {}}
	func_def = tool.get("function", {})
	if not func_def:
	continue
	converted_tool["function"]["name"] = func_def.get("name", "")
	converted_tool["function"]["description"] = func_def.get("description", "")
	if "parameters" in func_def:
	params = func_def["parameters"]
	converted_params = {"type": "object"}
	if "properties" in params:
	converted_properties = {}
	for prop_name, prop_value in params["properties"].items():
	cleaned = clean_schema_property(prop_value)
	if cleaned: # Aggiungi solo se il dizionario non è vuoto
	converted_properties[prop_name] = cleaned
	if converted_properties:
	converted_params["properties"] = converted_properties
	if "required" in params:
	converted_params["required"] = params["required"]
	converted_tool["function"]["parameters"] = converted_params
	converted_schema.append(converted_tool)
	return converted_schema

	def clean_schema_property(prop):
	if not isinstance(prop, dict):
	return prop
	result = {}
	for key, value in prop.items():
	if key in ("title", "default"):
	continue
	elif key == "anyOf":
	if isinstance(value, list):
	for item in value:
	if isinstance(item, dict) and item.get("type") != "null":
	cleaned_item = clean_schema_property(item)
	for k, v in cleaned_item.items():
	if k not in result:
	result[k] = v
	break
	elif key == "oneOf":
	if isinstance(value, list) and len(value) > 0:
	cleaned_item = clean_schema_property(value[0])
	for k, v in cleaned_item.items():
	if k not in result:
	result[k] = v
	elif isinstance(value, dict):
	cleaned_item = clean_schema_property(value)
	for k, v in cleaned_item.items():
	if k not in result:
	result[k] = v
	elif key == "properties" and isinstance(value, dict):
	new_props = {}
	for prop_name, prop_value in value.items():
	cleaned_prop = clean_schema_property(prop_value)
	if cleaned_prop:
	new_props[prop_name] = cleaned_prop
	if not new_props: # Se vuoto, sostituisci con dummy
	new_props = {"dummy": {"type": "string"}}
	result[key] = new_props
	elif key == "items" and isinstance(value, dict):
	result[key] = clean_schema_property(value)
	elif isinstance(value, list):
	result[key] = [clean_schema_property(item) if isinstance(item, dict) else item for item in value]
	else:
	result[key] = value
	if "type" not in result and "properties" in result and result["properties"]:
	result["type"] = "object"
	return result

	def convert_payload_for_gemini(payload: ChatCompletionRequest):
	if hasattr(payload, "model_dump"):
	payload_converted = json.loads(payload.model_dump_json())
	elif isinstance(payload, dict):
	payload_converted = payload.copy()
	else:
	raise ValueError("Formato payload non supportato")
	if "tools" in payload_converted:
	payload_converted["tools"] = convert_openai_schema_for_gemini(payload_converted["tools"])
	new_payload = ChatCompletionRequest.model_validate(payload_converted)
	return new_payload

	# ---------------------------------- Funzioni per Chat Completion ---------------------------------------
	# Chiama API (senza Streaming)
	def call_api_sync(params: ChatCompletionRequest):
	''' Chiamata API senza streaming. Se da errore 429 lo rifa'''
	try:
	client = get_openai_client()
	if params.messages:
	params.messages = sanitize_messages(params.messages)
	params = convert_payload_for_gemini(params)
	print(params)
	response_format = getattr(params, 'response_format', None)
	if response_format and getattr(response_format, 'type', None) == 'json_schema':
	response = client.beta.chat.completions.parse(**params.model_dump())
	else:
	response = client.chat.completions.create(**params.model_dump())
	return response
	except Exception as e:
	if "429" in str(e):
	time.sleep(2)
	return call_api_sync(params)
	else:
	raise e

	# Chiama API (con Streaming)
	async def _resp_async_generator(params: ChatCompletionRequest):
	''' Chiamata API con streaming. Se da errore 429 lo rifa'''
	client = get_openai_client()
	try:
	response = client.chat.completions.create(**params.model_dump())
	if params.messages:
	params.messages = sanitize_messages(params.messages)
	params = convert_payload_for_gemini(params)
	for chunk in response:
	chunk_data = chunk.to_dict() if hasattr(chunk, "to_dict") else chunk
	yield f"data: {json.dumps(chunk_data)}\n\n"
	await asyncio.sleep(0.01)
	yield "data: [DONE]\n\n"
	except Exception as e:
	if "429" in str(e):
	await asyncio.sleep(2)
	async for item in _resp_async_generator(params):
	yield item
	else:
	error_data = {"error": str(e)}
	yield f"data: {json.dumps(error_data)}\n\n"

	# ---------------------------------- Metodi API ---------------------------------------
	@app.get("/")
	def read_general():
	return {"response": "Benvenuto"}

	@app.get("/health")
	async def health_check():
	return {"message": "success"}

	@app.post("/v1/chat/completions", dependencies=[Depends(verify_api_key)])
	async def chat_completions(req: ChatCompletionRequest):
	try:
	if not req.messages:
	raise HTTPException(status_code=400, detail="Nessun messaggio fornito")
	if not req.stream:
	return call_api_sync(req)
	else:
	return StreamingResponse(_resp_async_generator(req), media_type="application/x-ndjson")
	except Exception as e:
	raise HTTPException(status_code=500, detail=str(e))

	if __name__ == "__main__":
	import uvicorn
	uvicorn.run("main:app", host="0.0.0.0", port=8000, reload=True)