欢迎光临散文网会员登陆 & 注册

RVC AI翻唱保姆级教程

2023-07-22 21:26 作者:FHfanshu 0人读过 | 我要投稿

1.软件准备

首先需要RVC 软件，它是SVC软件的一种，特点就是门槛低效果好，作者是B站的花儿不哭大佬，最新整合包在这里：【AI变声器】RVC AI实时变声器717版,新增GPU系rmvpe算法,胎教级使用教程_哔哩哔哩_bilibili

提醒：RVC软件作为AI翻唱软件的一种，对电脑的配置要求比较高，你的电脑需要是N卡，且显存4GB以上才能顺畅推理（不是模型训练），配置差的朋友也不是没有路可走，可以使用autodl.com这个网站租用显卡，下面会讲使用教程。

然后需要一个人声伴奏分离软件，我使用的是UVR5，当然你使用别的如ripx什么的也没问题。最强伴奏人声提取工具 - 开源免费，一键安装，直接使用！| Ultimate Vocal Remover | UVR5_哔哩哔哩_bilibili

夸克网盘：https://pan.quark.cn/s/816a932fc26c
123云盘：https://www.123pan.com/s/RiyA-Z5U03 提取码:hjhj

人声伴奏得合并对吧，这里使用的是Adobe Audition，也可以用OneStudio等软件做多轨混音。这里Bing一下就容易搞到软件，我就不多赘述了

然后就可以开始了。

2.RVC的Windows本地使用

当你下载好了RVC整合包，将其解压

解压好长这个样子

先别怕，往下翻

找到这俩。模型推理是我们需要的

如果找不到的话，可以新建一个文本文件，然后键入

并把文件后缀改成.bat运行即可。

如果双击没反应，就把pause删掉试试。

双击后是这样的一个控制台，稍等软件加载

等一会会弹出一个网页，这就是软件的界面，你可以在这边进行模型推理和伴奏人声分离（虽然RVC用的也是UVR，但是独立的UVR软件毕竟模型更多更干净）

RVC软件界面

1.模型推理

准备好干声文件，选择推理音色（没有模型的话点我动态，置顶有TTF2模型和APEX模型）

模型下载好后放进RVC软件的weights文件夹内（不是UVR_weights）

推理音色选择

选择好你喜欢的音色后，输入音频完整路径（最好音频文件名字不要带中文，而且包括扩展名一并输入）

音频文件路径示范

现在讲解一下各个参数什么意思

这俩现在已经不重要了

这个值越大转换输出的人声越接近你模型的音色

这个我不清楚，保持默认就行

如其解释

然后就可以点转换按钮了！

转换完成

Chromium内核的浏览器应该都能下载吧（如Edge/Chrome）

下载完成

下载完长这样，记得重命名一下

2.模型训练

注意，模型训练极度吃显存大小，显存8GB以下的就只能观望了（或者云端租用显卡训练）

模型训练，你需要准备模型的训练集，由于目前只支持单人语音训练，训练集要求3分钟以上单人干净的说话语音（不带背景音）,训练集可以是多个文件，只要在同一文件夹内即可。

希尔的游戏语音

然后打开RVC软件

“实验名”就是模型名字，支持中文。采样率影响不大（主要是对显存占用的影响，咱反正听不出区别），用默认的就好了，V1V2的话我趋向于选择V2，当然也有人说V2不如V1什么的，看你实际效果啦。

他这里有Step 1 2这样的，咱可以不用理step2

填写训练设置

由于RVC训练每保存一次模型就会吃1GB左右空间，你可以提高一点保存频率。救救硬盘空间

Epoch我一般是60起步，120左右。

Batch Size指的是AI在学习的过程中一次学习参照的音频文件数量，越大越吃显存，我这里拿云端的3060 12G炼的话batch size选8基本上能吃满

别的软件本身介绍挺详细的，自己看一下应该也懂了。

OK然后点一键训练即可

软件会从1epoch开始到你设置的那个epoch数为止

3.RVC的云端训练（autodl.com)

注册好后网站页面长这样

租显卡嘛，鼠标悬停到用户名上，你就可以看见充值按钮了，先充10块钱试试也行。

（这个平台也是可以让你跑AI绘画的）

充值好后点击算力市场

（炼这个显卡不用多强，显存大就行，所以挑个便宜一点的玩玩就行，3090 1.66元一小时左右。）

这个手速得快，机子得抢的，别愣着。

提醒：别选北京地区的，因为部分原因，你点不开自定义服务，还要端口映射什么的，比较麻烦。

抢完马上选"社区镜像"

选择镜像

选完点立即创建

点击JupyterLab

好，又是终端，但是你先别急

点进这个文件夹

点这个加号

确认好路径后点进终端

由于它默认的端口号是7865，不是autodl自定义服务的6006，因此我们需要先修改文件

在左侧找到这个文件，双击打开

好，代码，但你别慌

翻到最底下，找到这个变量

改成6006，CTRL+S保存文件

好，现在返回终端

在终端内输入以下命令，回车

正确的输出

返回控制台

点击自定义服务

好，软件打开了

点模型训练

上传训练集：

随便创建一个文件夹

直接拖进去就行，慢慢等他上传

复制文件路径

接下来的操作和本地训练没有太大区别，唯一区别是云端是Linux系统，文件路径会有所区别，在JupyterLab里上传好训练集，复制训练集路径

路径前面都要加个/root/

路径前面都要加/root/，不然识别不到，会报错

然后照前面的方式就可以开始训练了

保存模型：

点进weights文件夹

右键然后下载即可

然后把模型pth文件转移到本地的RVC软件的weights文件夹里就行了

4.UVR伴奏人声分离软件的使用

图标长这样

软件本体GUI界面

选择输入和输出（文件路径格式和rvc一样）

有好几种处理方式，一般使用MDX-NET，速度快效果好

上来先拿9482或者Main模型处理一遍

然后拿处理好后的人声

再处理一遍

再处理一遍时，需更换模型，我们已经将人声分离出来了，但是人声依旧带和声和混响，这是我们应该去除的。

考虑到去混响模型并没有自带，需要额外下载

选择里面的FoxJoy Deverb模型

注意：因为我已经下载了Deverb模型所以下载中心中并没有显示MDX-Net Model:Deverb HQ-By FoxJoy，不要下错了

然后再处理一遍，最后拿Karaoke模型再对这种（No Other）后缀的处理一遍

Pkf文件是我拿Au打开后生成的文件

得到最后的干净人声和和声（上面是和声，下面是人声）

然后就可以丢进RVC里面进行推理了。

5.混音

这个可能得看一些教程学Au 不过Au用起来也不难

打开Au

大概长这样

2.

文件-新建-多轨会话

把推理好的人声、伴奏、和声和混响拖进去就行

3.保存文件

文件-导出-多轨混音-整个会话

选格式、路径导出即可

标签：AI 泰坦陨落野生技术协会 AI翻唱

RVC AI翻唱保姆级教程的评论 (共条)