DDSP-SVC训练详细教程：门槛最低的AI声音转换模型

2023-04-13 21:38 作者:INT16 0人读过 | 我要投稿

声明：本软件开源协议为MIT。简单来说，你使用这个软件进行的行为，责任全都由你自己承担。所以请自重

DDSP-SVC优势在于训练和推理速度比so-vits-svc快很多。基本上普通的nvidia显卡都能训练。歌声效果可能不如so-vits-svc，但是实时变声效果比它好很多，主要优势还是硬件要求低

数据集准备

44100Hz采样率，wav格式，PCM-16编码，单声道，时长建议高于2s低于15s

100条也许可以训练，我用了320条。

选10条优质的放在data\val\audio文件夹下作为验证集，剩下的放在data\train\audio

然后打开webui，选择你的训练设置

batch_size可以不动，如果爆显存了可以调小。其他保持默认即可。显存较小的可以取消勾选“启用缓存”。设置完毕点击“创建配置文件”。你应该可以在configs文件夹下看到opt.yaml这个文件。可以打开检查里面的配置是否正确

预处理

点击“开始预处理”。耐心等待一会，应该会出现这样的进度条

结束后开始训练。

训练

点击“开始训练”，如果命令行显示进度是正常的。

可视化进度

启动可视化按钮只在Linux上工作。在Windows下启动你需要在根目录新建一个txt，输入

cd DDSP-SVC&&.\runtime\Scripts\activate.bat&&.\runtime\python.exe .\runtime\Scripts\tensorboard.exe --logdir=exp

并重命名后缀为bat，然后双击

然后再浏览器里面输入下面显示的网址就行。train/loss越低越好。等待它下降，到快要停止下降的时候差不多就行了

标签：

DDSP-SVC训练详细教程：门槛最低的AI声音转换模型的评论 (共条)