配置指南

本文档介绍如何配置 VoiceDialogue 系统。

启动参数

通过 main.py 的命令行参数可以方便地进行配置：

参数	缩写	可选值	默认值	描述
`--mode`	`-m`	`cli`, `api`	`cli`	设置运行模式
`--language`	`-l`	`zh`, `en`	`zh`	(CLI模式) 设置用户语言
`--speaker`	`-s`	(动态获取)	`沈逸`	(CLI模式) 设置TTS语音角色
`--host`		IP地址	`0.0.0.0`	(API模式) 服务器主机
`--port`	`-p`	端口号	`8000`	(API模式) 服务器端口
`--reload`		无	`False`	(API模式) 启用热重载

支持的说话人角色（动态加载）:

中文角色：罗翔, 马保国, 沈逸, 杨幂, 周杰伦, 马云
英文角色：Heart, Bella, Nicole

高级配置

大语言模型 (LLM)

模型路径和参数: LLM 的模型和推理参数目前在代码中硬编码，方便快速启动。
文件位置: src/VoiceDialogue/services/text/generator.py
自定义: 你可以修改 LLMResponseGenerator 类中的配置。

语音识别 (ASR)

引擎自动选择: 系统会根据 --language 参数自动选择最合适的 ASR 引擎。
模型配置: ASR 模型的具体配置位于 src/VoiceDialogue/services/speech/recognizers/manager.py。

系统提示词 (System Prompt)

功能: 定义 AI 角色的行为和说话风格。
文件位置: src/VoiceDialogue/services/text/generator.py
自定义: 你可以修改系统提示词变量的值。

构建完整应用

项目提供了完整的构建脚本，可以一键构建包含Python后端和Electron前端的完整应用：

首先，激活当前 Python 环境

source .venv/bin/activate
# 或使用 conda
conda activate voicedialogue

使用构建脚本

# 使用构建脚本（推荐）
bash scripts/build.sh

# 或分别构建
bash scripts/build-python.sh  # 构建Python后端
bash scripts/build-electron.sh # 构建Electron前端

# 清理构建产物
bash scripts/clean.sh