RVC需要从Hugging Face space 下载哪些预模型?
RVC从Hugging Face下载的核心预模型(分类+地址+用途)
RVC运行/推理/训练所需的预模型主要分为核心必装基础模型(无则无法运行)和可选预训练音色模型(新手直接用,无需自训),以下是具体分类、下载地址和使用说明,所有模型均来自Hugging Face的公开仓库/Spaces:
一、核心必下载的基础模型(RVC运行的前提)
这类模型是RVC提取语音特征、还原语音波形的核心,必须下载并放到指定目录,否则无法启动或进行语音转换。
| 模型类型 | 作用(通俗解释) | 推荐版本 | Hugging Face下载地址 | 存放路径(RVC项目内) |
|---|---|---|---|---|
| 内容编码器模型 | 提取语音的"内容特征"(核心) | Content Vec(推荐) (替代旧版) |
https://huggingface.co/voicepaw/awesome-speech-recognition-ml-models/resolve/main/contentvec/ | models/encoder/ |
| (替代旧版) | (替代老旧的Hubert模型) | Hubert Base (可选) | https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt | models/encoder/ |
| 声码器模型 | 将特征还原为语音波形(音质) | NSF-HiFiGAN(音质最优) (备选) |
https://huggingface.co/luoyily/NSF-HiFiGAN/resolve/main/nsf_hifigan_20221211.zip | 解压到models/vocoder/ |
| (备选) | (不同版本适配不同场景) | HiFi-GAN v1/v2 | https://huggingface.co/jaywalnut310/vits/resolve/main/pretrained_vits/ | models/vocoder/ |
关键说明:
- Content Vec是新版RVC的标配,替代了旧版的Hubert,优先下载这个;
- 声码器优先选NSF-HiFiGAN,输出语音更自然,HiFi-GAN作为备选(部分老模型适配)。
二、可选的预训练音色转换模型(新手直接用,无需自训)
这类是社区训练好的"音色模型",直接放到RVC中就能实现语音转换(比如把你的声音换成周杰伦、林俊杰等音色),主要从Hugging Face Spaces/Repos下载:
1. 官方/主流社区分享的预训练模型
- 核心地址:
- 常见类型:
- 通用基础模型:适合新手测试(比如"base_rvc_model");
- 明星音色模型:周杰伦、林俊杰、陈奕迅、初音未来等(社区分享,非官方);
- 多语言模型:支持中文/英文/日语的通用音色模型。
2. 模型格式与存放路径
预训练音色模型的后缀为 .pth/.ckpt,下载后放到RVC项目的 weights/ 目录下即可(子文件夹可自定义,比如weights/zhoujielun/)。
三、下载方法(适配新手,两种方式)
方式1:浏览器直接下载(最简单)
- 打开对应的Hugging Face链接;
- 找到模型文件(.pt/.pth/.zip),点击文件旁的「Download」按钮;
- 下载后按上述路径放到RVC项目的对应文件夹,压缩包需解压。
方式2:Git LFS克隆(适合批量下载,需安装Git LFS)
# 1. 安装Git LFS(Windows/macOS/Linux)
git lfs install
# 2. 克隆编码器模型仓库(示例:Content Vec)
git clone https://huggingface.co/voicepaw/awesome-speech-recognition-ml-models
# 3. 复制contentvec相关文件到RVC的models/encoder/目录
# 3. 克隆声码器模型(示例:NSF-HiFiGAN)
git clone https://huggingface.co/luoyily/NSF-HiFiGAN
# 4. 复制解压后的nsf_hifigan文件到models/vocoder/
四、关键注意事项
- 国内访问问题:Hugging Face直连可能慢/无法访问,可使用镜像(如https://hf-mirror.com/)替换原地址,比如将
https://huggingface.co/xxx改为https://hf-mirror.com/xxx; - 模型大小:基础模型(编码器+声码器)合计约1-2GB,预训练音色模型单文件约100-500MB,确保磁盘空间充足;
- 版本匹配:新版RVC(v2+)优先用Content Vec + NSF-HiFiGAN,旧版RVC可能需要Hubert + 旧版HiFi-GAN。
总结
- RVC必下载的核心预模型是:Content Vec(编码器)+ NSF-HiFiGAN(声码器),存放至
models/encoder/和models/vocoder/; - 可选的预训练音色模型从Hugging Face Spaces/Collections下载,放到
weights/目录即可直接用于语音转换; - 国内下载建议替换为Hugging Face镜像地址,避免下载失败/速度过慢。
本文由 RVC-VoiceChanger.top 原创发布,转载请注明出处。