import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizer

# Задаем имя модели на Hugging Face
model_name = "AnatoliiPotapov/T-lite-instruct-0.1"
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Загрузка модели с параметрами для оптимизации работы на CPU
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", low_cpu_mem_usage=True)

# Функция для генерации ответа от модели
def generate_response(input_text):
    inputs = tokenizer(input_text, return_tensors="pt")
    outputs = model.generate(inputs["input_ids"], max_length=50)
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return response

# Настройка интерфейса Gradio
iface = gr.Interface(
    fn=generate_response, 
    inputs="text", 
    outputs="text",
    title="Telegram-like Chatbot",
    description="Введите текст и получите ответ от модели"
)

# Запуск интерфейса с публичным доступом
iface.launch(share=True, server_port=7860)