欢迎光临散文网 会员登陆 & 注册

DDSP-SVC训练详细教程:门槛最低的AI声音转换模型

2023-04-13 21:38 作者:INT16  | 我要投稿

声明:本软件开源协议为MIT。简单来说,你使用这个软件进行的行为,责任全都由你自己承担。所以请自重

DDSP-SVC优势在于训练和推理速度比so-vits-svc快很多。基本上普通的nvidia显卡都能训练。歌声效果可能不如so-vits-svc,但是实时变声效果比它好很多,主要优势还是硬件要求低

数据集准备

44100Hz采样率,wav格式,PCM-16编码,单声道,时长建议高于2s低于15s

100条也许可以训练,我用了320条。

选10条优质的放在data\val\audio文件夹下作为验证集,剩下的放在data\train\audio

然后打开webui,选择你的训练设置

batch_size可以不动,如果爆显存了可以调小。其他保持默认即可。显存较小的可以取消勾选“启用缓存”。设置完毕点击“创建配置文件”。你应该可以在configs文件夹下看到opt.yaml这个文件。可以打开检查里面的配置是否正确

预处理

点击“开始预处理”。耐心等待一会,应该会出现这样的进度条

结束后开始训练。

训练

点击“开始训练”,如果命令行显示进度是正常的。

可视化进度

启动可视化按钮只在Linux上工作。在Windows下启动你需要在根目录新建一个txt,输入

cd DDSP-SVC&&.\runtime\Scripts\activate.bat&&.\runtime\python.exe .\runtime\Scripts\tensorboard.exe --logdir=exp

并重命名后缀为bat,然后双击

然后再浏览器里面输入下面显示的网址就行。train/loss越低越好。等待它下降,到快要停止下降的时候差不多就行了


DDSP-SVC训练详细教程:门槛最低的AI声音转换模型的评论 (共 条)

分享到微博请遵守国家法律