RVC需要从Hugging Face space 下载哪些预模型？

RVC从Hugging Face下载的核心预模型（分类+地址+用途）

RVC运行/推理/训练所需的预模型主要分为核心必装基础模型（无则无法运行）和可选预训练音色模型（新手直接用，无需自训），以下是具体分类、下载地址和使用说明，所有模型均来自Hugging Face的公开仓库/Spaces：

一、核心必下载的基础模型（RVC运行的前提）

这类模型是RVC提取语音特征、还原语音波形的核心，必须下载并放到指定目录，否则无法启动或进行语音转换。

模型类型	作用（通俗解释）	推荐版本	Hugging Face下载地址	存放路径（RVC项目内）
内容编码器模型	提取语音的"内容特征"（核心）	Content Vec（推荐）（替代旧版）	https://huggingface.co/voicepaw/awesome-speech-recognition-ml-models/resolve/main/contentvec/	`models/encoder/`
（替代旧版）	（替代老旧的Hubert模型）	Hubert Base (可选)	https://huggingface.co/lj1995/VoiceConversionWebUI/resolve/main/hubert_base.pt	`models/encoder/`
声码器模型	将特征还原为语音波形（音质）	NSF-HiFiGAN（音质最优）（备选）	https://huggingface.co/luoyily/NSF-HiFiGAN/resolve/main/nsf_hifigan_20221211.zip	解压到`models/vocoder/`
（备选）	（不同版本适配不同场景）	HiFi-GAN v1/v2	https://huggingface.co/jaywalnut310/vits/resolve/main/pretrained_vits/	`models/vocoder/`

关键说明：

Content Vec是新版RVC的标配，替代了旧版的Hubert，优先下载这个；
声码器优先选NSF-HiFiGAN，输出语音更自然，HiFi-GAN作为备选（部分老模型适配）。

二、可选的预训练音色转换模型（新手直接用，无需自训）

这类是社区训练好的"音色模型"，直接放到RVC中就能实现语音转换（比如把你的声音换成周杰伦、林俊杰等音色），主要从Hugging Face Spaces/Repos下载：

1. 官方/主流社区分享的预训练模型

核心地址：
- RVC官方汇总：https://huggingface.co/spaces/RVC-Project/Retrieval-Based-Voice-Conversion-WebUI
- 社区优质模型：https://huggingface.co/collections/liujing04/awesome-rvc-models-6511c087743e6349a16095939
常见类型：
- 通用基础模型：适合新手测试（比如"base_rvc_model"）；
- 明星音色模型：周杰伦、林俊杰、陈奕迅、初音未来等（社区分享，非官方）；
- 多语言模型：支持中文/英文/日语的通用音色模型。

2. 模型格式与存放路径

预训练音色模型的后缀为 .pth/.ckpt，下载后放到RVC项目的 weights/ 目录下即可（子文件夹可自定义，比如weights/zhoujielun/）。

三、下载方法（适配新手，两种方式）

方式1：浏览器直接下载（最简单）

打开对应的Hugging Face链接；
找到模型文件（.pt/.pth/.zip），点击文件旁的「Download」按钮；
下载后按上述路径放到RVC项目的对应文件夹，压缩包需解压。

方式2：Git LFS克隆（适合批量下载，需安装Git LFS）

# 1. 安装Git LFS（Windows/macOS/Linux）
git lfs install

# 2. 克隆编码器模型仓库（示例：Content Vec）
git clone https://huggingface.co/voicepaw/awesome-speech-recognition-ml-models
# 3. 复制contentvec相关文件到RVC的models/encoder/目录

# 3. 克隆声码器模型（示例：NSF-HiFiGAN）
git clone https://huggingface.co/luoyily/NSF-HiFiGAN
# 4. 复制解压后的nsf_hifigan文件到models/vocoder/

四、关键注意事项

国内访问问题：Hugging Face直连可能慢/无法访问，可使用镜像（如https://hf-mirror.com/）替换原地址，比如将https://huggingface.co/xxx改为https://hf-mirror.com/xxx；
模型大小：基础模型（编码器+声码器）合计约1-2GB，预训练音色模型单文件约100-500MB，确保磁盘空间充足；
版本匹配：新版RVC（v2+）优先用Content Vec + NSF-HiFiGAN，旧版RVC可能需要Hubert + 旧版HiFi-GAN。

总结

RVC必下载的核心预模型是：Content Vec（编码器）+ NSF-HiFiGAN（声码器），存放至models/encoder/和models/vocoder/；
可选的预训练音色模型从Hugging Face Spaces/Collections下载，放到weights/目录即可直接用于语音转换；
国内下载建议替换为Hugging Face镜像地址，避免下载失败/速度过慢。

本文由 RVC-VoiceChanger.top 原创发布，转载请注明出处。