1、安装python3 3.10.9版本

下载地址 https://mirrors.aliyun.com/python-release/windows/python-3.10.9-amd64.exe

安装时不要勾选 Add to path ，选择自定义安装，安装目录为D:\02soft\python310

配置pypi源

新建"C:\Users\73277\pip\pip.ini"文件，其中73277为我的用户名

在文件中写入以下内容：

[global]
index-url = https://mirrors.aliyun.com/pypi/simple/
[install]
trusted-host = mirrors.aliyun.com

保存并关闭文件。

2、下载模型

Qwen3-TTS合集详情-来自Qwen · 魔搭社区

模型名称	参数量	采样率	核心特性/用途	支持语言	其他关键信息
`Qwen/Qwen3-TTS-12Hz-1.7B-VoiceDesign`	1.7B	12 kHz	声音设计 (Voice Design)：支持精细控制音色、语速、语调等语音属性，适合定制化语音生成与角色配音。	多语言（含中文）	标签含 `audio`；侧重可控性与表现力
`Qwen/Qwen3-TTS-12Hz-1.7B-Base`	1.7B	12 kHz	基础版大模型：通用高质量语音合成，平衡性能与效果，适用于标准TTS任务。	多语言（含中文）	下载量最高（78.1k），推荐作为默认选择
`Qwen/Qwen3-TTS-12Hz-0.6B-Base`	0.6B	12 kHz	轻量级基础版：参数量小，推理更快、显存占用低，适合资源受限环境（如本地部署、边缘设备）。	中文等10个语言	标签明确标注“中文等10个语言”；下载量42.0k
`Qwen/Qwen3-TTS-12Hz-0.6B-CustomVoice`	0.6B	12 kHz	轻量级定制语音：支持基于少量样本（如3~5秒）的个性化声音克隆（Custom Voice），兼顾效率与定制能力。	中文等10个语言	明确支持“CustomVoice”，适合快速构建专属语音助手
`Qwen/Qwen3-TTS-Tokenzier-12Hz`	—（仅分词器）	12 kHz	专用分词器（Tokenizer）：非完整模型，仅为上述TTS模型提供文本预处理（如音素/字节对编码），需配合主模型使用。	—	标签含 `qwen3_tts_tokenizer_12hz`；不可单独用于生成语音

显卡4G内存以下选择0.6B模型，4G以上选择1.7B模型。

Qwen3-TTS全面开源：支持超低延迟流式合成的多语言语音大模型 · 研习社

#创建项目目录
D:\08pythonproject\qwentts
#创建虚拟环境
D:\08pythonproject\qwentts>"D:\02soft\python310\python.exe" -m venv venv-python310
#激活虚拟环境
D:\08pythonproject\qwentts>venv-python310\Scripts\activate
#升级PIP
python.exe -m pip install --upgrade pip
#安装modelscope
pip install modelscope
#创建模型存放目录
"D:\07modeles\TTS\Qwen\Qwen3-TTS-12Hz-1.7B-CustomVoice"
#下载整个模型repo到指定目录
modelscope download --model Qwen/Qwen3-TTS-12Hz-1.7B-CustomVoice --local_dir "D:\07modeles\TTS\Qwen\Qwen3-TTS-12Hz-1.7B-CustomVoice"
modelscope download --model IndexTeam/IndexTTS-2 --local_dir "D:\07modeles\TTS\IndexTeam\IndexTTS"

3、安装显卡驱动

根据显卡型号和对应系统下载驱动进行安装。

驱动下载地址：NVIDIA GeForce 驱动程序 - N 卡驱动 | NVIDIA

CUDA Toolkit下载地址：CUDA Toolkit Archive | NVIDIA Developer

显卡驱动安装好以后，打开cmd 输入nvidia-smi命令查看显卡信息，如下CUDA Version:13.1 则 Pytorch的CUDA版本需要选择小于13.1的，我这里选择12.8版本

4、安装 torch torchvision torchaudio

Pytorch官网 PyTorch

进入项目目录D:\08pythonproject\qwentts，激活虚拟环境。安装以下包：

pip uninstall torch torchvision torchaudio -y
#Pytorch官方下载方式,并指定版本window
pip install torch==2.8.0+cu128 torchvision==0.23.0+cu128 torchaudio==2.8.0+cu128 --index-url https://download.pytorch.org/whl/cu128
#Pytorch官方下载方式,并指定版本linux
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
#50系列显卡推荐安装预览版本
pip3 install --pre torch torchvision --index-url https://download.pytorch.org/whl/nightly/cu130
#https://mirrors.aliyun.com/pytorch-wheels/nightly/cu130/
pip3 install --pre torch torchvision --index-url https://mirrors.aliyun.com/pytorch-wheels/nightly/cu130/
#torch-2.10.0.dev20250927+cu130-cp310-cp310-win_amd64.whl
#torchaudio-2.10.0.dev20251018+cu130-cp310-cp310-win_amd64.whl
#torchvision-0.25.0.dev20250927+cu130-cp310-cp310-win_amd64.whl
#阿里云的镜像，下载有问题
pip install torch==2.8.0+cu128 torchvision==0.23.0+cu128 torchaudio==2.8.0+cu128 --index-url https://mirrors.aliyun.com/pytorch-wheels/cu128/
#可以试试南京大学的
pip3 install torch==2.8.0+cu128 torchvision==0.23.0+cu128 torchaudio==2.8.0+cu128  --index-url https://mirrors.nju.edu.cn/pytorch/whl/cu128

#也可以将whl文件下载到本地通过pip install *.whl进行安装，[推荐使用这个方式]
访问https://mirrors.aliyun.com/pytorch-wheels/cu128/ 下载以下3个文件
torch-2.8.0+cu128-cp310-cp310-win_amd64.whl
torchaudio-2.8.0+cu128-cp310-cp310-win_amd64.whl
torchvision-0.23.0+cu128+cu128-cp310-cp310-win_amd64.whl
然后执行pip install 安装
pip install ./torch-2.8.0+cu128-cp310-cp310-win_amd64.whl ./torchaudio-2.8.0+cu128-cp310-cp310-win_amd64.whl ./torchvision-0.23.0+cu128+cu128-cp310-cp310-win_amd64.whl

5、语音合成

下载安装VScode Visual Studio Code - The open source AI code editor | Your home for multi-agent development

安装好VScode以后需要再VScode中安装一下Python插件