【sovitsAI语音】在colab部署,新人学习分享

最近很多人都学习了@Rcell在github上的项目https://github.com/innnky/so-vits-svc,制作了有趣的视频和懒人包。首先对作者Rcell致敬,开发了这么有趣的项目。我没有合适的显卡,加上不想配置本地环境,所以用了google Colab。
colab可以免费使用,但是时间长了,会分不到GPU资源,所以时间较长的训练可能会跑不玩。付费的colab pro现在是84块左右,一个月时限,99个计算单元,大概1个小时2个计算单元,也就是总共可以用50个小时左右。昨天我分到的显卡是tesla t4,大约相当于显存翻倍的2070s。

进入https://github.com/innnky/so-vits-svc,可以点击32k处选择分支版本,我选择4.0版本。

作者将python程序的执行顺序写在colab上,很贴心。阅读完README.MD后点击Open in Colab.


前面一直执行命令即可,等前一个命令执行完再执行后一个命令。







将数据做成.wav文件压缩上传到谷歌云盘,建一个叫dataset的文件夹,存在里面。这里是EULA.zip.


unzip -d /content/so-vits-svs/dataset_raw {ZIP_NAME}.zip 将该zip文件解压到dataset_raw.
该压缩文件是/content/drive/MyDrive/dataset/kiritan.zip

DATASETNAME,可以修改,但是要和上传存在MyDrive/dataset/下的文件名同名。这里我的dataset下存的是EULA.zip,所以DATASETNAME:EULA。在谷歌盘里,根目录下为dataset/,挂载到Colab是/content/drive/MyDrive/dataset/。
修改完成后点击按钮执行。
命令会将/conntent/drive/MyDrive/dataset/EULA.zip解压缩到/content/so-vits-svc/dataset_raw/EULA/下。现在点击colab最左边的文件,文件结构是这样。

如果要处理不同的角色的声音,只需重新命名,上传,改DATASETNAME就可以了。

这时文件结构会变成:

这个dataset和谷歌云盘里村zip文件的dataset不是一个文件夹。

生成了/content/so-vits-svc/configs/config.json 用于控制训练时的参数的配置文件。/content/so-vits-svc/filelists/test.txt(测试模型用),/content/so-vits-svc/filelists/train.txt(训练模型用),/content/so-vits-svc/filelists/val.txt(用于测试时,与模型的输出做对比,也就是说,test.txt与val.txt是一样的。)

将数据备份到谷歌云盘。

可能实验不是一天能做完,就可以将上次备份的数据复制过来。

开始训练,第一次训练save_to_drive和pre_pth都要打勾。主要是要用到/content/so-vits-svc/logs/44k/G_0.pth和D_0.pth。以后训练训练出自己的记录点,比如1000steps后得到个G_1000.pth和D_1000.pth,pre_pth就不打勾。可以从该记录点开始继续训练。


然后就可以开始了。可以在config.json里面自定义参数。



因为有作者的一键部署脚本,在Colab上运行这个项目还是很简单的。学习记录而已,希望可以帮到一些伙伴。