Spaces:

Gilvaa
/

lovass

Sleeping

App Files Files Community

lovass / app.py

Gilvaa

Update app.py

c559f51 verified 21 days ago

raw

history blame

8.14 kB

	# app.py
	# Qwen ✖ SimSimi Hybrid Chat for Hugging Face Spaces
	# ---------------------------------------------------
	# Requirements (requirements.txt):
	# transformers
	# torch
	# accelerate
	# gradio
	# httpx

	import os
	import re
	import asyncio
	import httpx
	import gradio as gr
	import torch
	from transformers import AutoTokenizer, AutoModelForCausalLM

	# ---------------------------
	# Config & Secrets
	# ---------------------------
	MODEL_ID = "huihui-ai/Qwen2.5-7B-Instruct-abliterated-v3"

	SIMSIMI_ENDPOINT = "https://wsapi.simsimi.com/190410/talk" # 固定版本化 SmallTalk endpoint
	SIMSIMI_API_KEY = os.getenv("SIMSIMI_API_KEY", "").strip()
	SIMSIMI_LANG = os.getenv("SIMSIMI_LANG", "ch").strip() # "ch"=中文简体, "en"=English, "zh"=繁中等
	SIMSIMI_BAD_MAX = float(os.getenv("SIMSIMI_BAD_MAX", "0.30"))

	# ---------------------------
	# Load Qwen
	# ---------------------------
	dtype = (
	torch.float16 if torch.cuda.is_available()
	else torch.bfloat16 if torch.backends.mps.is_available()
	else torch.float32
	)
	tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
	model = AutoModelForCausalLM.from_pretrained(
	MODEL_ID,
	torch_dtype=dtype,
	device_map="auto",
	trust_remote_code=True
	)

	if tokenizer.pad_token is None:
	tokenizer.pad_token = tokenizer.eos_token

	SYSTEM_PROMPT = "You are a helpful, concise, and friendly AI assistant. Keep answers direct and useful."

	def qwen_generate(messages, max_new_tokens=512, temperature=0.7, top_p=0.9):
	"""
	messages: list[{"role": "system"\|"user"\|"assistant", "content": str}]
	"""
	try:
	prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
	inputs = tokenizer([prompt], return_tensors="pt").to(model.device)
	with torch.no_grad():
	outputs = model.generate(
	**inputs,
	max_new_tokens=max_new_tokens,
	do_sample=True,
	temperature=temperature,
	top_p=top_p,
	eos_token_id=tokenizer.eos_token_id,
	pad_token_id=tokenizer.pad_token_id,
	)
	# 仅取新增的部分
	gen_ids = outputs[0][inputs["input_ids"].shape[1]:]
	text = tokenizer.decode(gen_ids, skip_special_tokens=True).strip()
	return text
	except Exception as e:
	return f"[Qwen 生成异常] {e}"

	# ---------------------------
	# SimSimi SmallTalk Bridge
	# ---------------------------
	async def simsimi_smalltalk(user_text: str, lang: str = None, bad_max: float = None, timeout: float = 10.0):
	"""
	调用 SimSimi SmallTalk：
	- Endpoint: https://wsapi.simsimi.com/190410/talk
	- Header: x-api-key: <Project Key>
	- Body: {"utext": "...", "lang":"ch", "atext_bad_prob_max": 0.3}
	"""
	if not SIMSIMI_API_KEY:
	return None, "未配置 SIMSIMI_API_KEY"

	lang = (lang or SIMSIMI_LANG or "ch").strip()
	bad = SIMSIMI_BAD_MAX if bad_max is None else float(bad_max)

	headers = {
	"Content-Type": "application/json",
	"x-api-key": SIMSIMI_API_KEY
	}
	payload = {
	"utext": user_text,
	"lang": lang,
	"atext_bad_prob_max": bad # 越小越干净（0.0~1.0）
	}

	try:
	async with httpx.AsyncClient(timeout=timeout) as client:
	r = await client.post(SIMSIMI_ENDPOINT, headers=headers, json=payload)
	r.raise_for_status()
	data = r.json()
	# 官方返回字段名为 atext（若你的项目返回有所不同，可改这里）
	reply = data.get("atext")
	if not reply:
	# 兼容少数场景
	reply = data.get("response") or data.get("msg")
	return reply, None
	except Exception as e:
	return None, f"SimSimi 调用失败: {e}"

	# ---------------------------
	# Simple Intent Router
	# ---------------------------
	CHATY_HINTS = [
	r"讲个(笑话\|段子)", r"无聊", r"随便聊",
	r"你(会\|能)吐槽", r"来点梗", r"夸我", r"损我一下",
	r"夸夸我", r"给我一句毒舌"
	]
	TASK_HINTS = [
	r"(怎么\|如何\|为何\|为什么\|为啥)",
	r"(写\|生成\|改\|优化).{0,12}(代码\|脚本\|文案\|提示词\|SQL\|正则)",
	r"(安装\|配置\|部署\|报错\|调试\|报错)",
	r"(引用\|数据\|来源\|对比\|表格)"
	]

	def is_chitchat(text: str) -> bool:
	if re.search("\|".join(TASK_HINTS), text, flags=re.I):
	return False
	if re.search("\|".join(CHATY_HINTS), text, flags=re.I):
	return True
	# 短句且非问答型，更可能是闲聊
	return (len(text) <= 22 and not re.search(r"[，。！？.!?？]", text))

	# ---------------------------
	# Hybrid Reply
	# ---------------------------
	async def hybrid_reply(history_messages, user_text, mode: str, lang: str, bad_max: float):
	"""
	mode:
	- "Auto 混合": 闲聊→SimSimi；任务→Qwen；二者都合适时先 Qwen 再 SimSimi 补一句
	- "只用 Qwen"
	- "只用 SimSimi"
	"""
	lang = (lang or SIMSIMI_LANG or "ch").strip()
	bad_max = SIMSIMI_BAD_MAX if bad_max is None else float(bad_max)

	if mode == "只用 SimSimi":
	sim, err = await simsimi_smalltalk(user_text, lang=lang, bad_max=bad_max)
	return sim or (f"[SimSimi 无回复] {err or '未知错误'}")

	if mode == "只用 Qwen":
	base = qwen_generate(history_messages + [{"role": "user", "content": user_text}])
	return base

	# Auto 混合
	if is_chitchat(user_text):
	sim, err = await simsimi_smalltalk(user_text, lang=lang, bad_max=bad_max)
	if sim:
	return sim
	# 兜底 Qwen
	return qwen_generate(history_messages + [{"role": "user", "content": user_text}])

	# 任务型：Qwen 主答，SimSimi 补一句“活泼结尾”
	base = qwen_generate(history_messages + [{"role": "user", "content": user_text}])
	sim_tail, _ = await simsimi_smalltalk(f"用一句简短幽默的方式做个收尾：{user_text}", lang=lang, bad_max=bad_max)
	if sim_tail:
	return f"{base}\n\n—— {sim_tail}"
	return base

	# ---------------------------
	# Gradio UI
	# ---------------------------
	with gr.Blocks(css="""
	#chatbot {height: 560px}
	""") as demo:
	gr.Markdown("## Qwen × SimSimi Hybrid Chat\n")

	# ✅ 页面只保留一个下拉框（含三种模式），以及提交/清空按钮
	mode_dd = gr.Dropdown(
	choices=["Auto 混合", "只用 Qwen", "只用 SimSimi"],
	value="Auto 混合",
	label="对话模式"
	)

	chatbox = gr.Chatbot(elem_id="chatbot")
	user_in = gr.Textbox(placeholder="输入内容，然后点击【提交】发送…", lines=2)
	submit_btn = gr.Button("提交", variant="primary")
	clear_btn = gr.Button("清空对话")

	# 内部状态：存储 Qwen 用的 messages
	state_msgs = gr.State([{"role": "system", "content": SYSTEM_PROMPT}])

	async def respond(user_text, history, messages, mode):
	user_text = (user_text or "").strip()
	if not user_text:
	return gr.update(), messages, ""
	# 使用环境变量作为 SimSimi 参数（不在页面暴露）
	lang = SIMSIMI_LANG
	bad_max = SIMSIMI_BAD_MAX

	messages = list(messages) if messages else [{"role": "system", "content": SYSTEM_PROMPT}]
	messages.append({"role": "user", "content": user_text})

	reply = await hybrid_reply(messages, user_text, mode=mode, lang=lang, bad_max=bad_max)

	messages.append({"role": "assistant", "content": reply})
	history = (history or []) + [[user_text, reply]]
	return history, messages, ""

	def clear_all():
	return [], [{"role": "system", "content": SYSTEM_PROMPT}]

	# 仅“提交”按钮触发发送；如需回车发送，可再加 user_in.submit(...)
	submit_btn.click(
	respond,
	inputs=[user_in, chatbox, state_msgs, mode_dd],
	outputs=[chatbox, state_msgs, user_in]
	)
	clear_btn.click(
	clear_all,
	inputs=None,
	outputs=[chatbox, state_msgs]
	)

	if __name__ == "__main__":
	demo.launch()