【sovitsAI语音】在colab部署，新人学习分享

2023-03-06 18:13 作者:Reborn_Reboot 0人读过 | 我要投稿

最近很多人都学习了@Rcell在github上的项目https://github.com/innnky/so-vits-svc，制作了有趣的视频和懒人包。首先对作者Rcell致敬,开发了这么有趣的项目。我没有合适的显卡，加上不想配置本地环境，所以用了google Colab。

colab可以免费使用，但是时间长了，会分不到GPU资源，所以时间较长的训练可能会跑不玩。付费的colab pro现在是84块左右，一个月时限，99个计算单元，大概1个小时2个计算单元，也就是总共可以用50个小时左右。昨天我分到的显卡是tesla t4，大约相当于显存翻倍的2070s。

进入https://github.com/innnky/so-vits-svc，可以点击32k处选择分支版本，我选择4.0版本。

作者将python程序的执行顺序写在colab上，很贴心。阅读完README.MD后点击Open in Colab.

前面一直执行命令即可，等前一个命令执行完再执行后一个命令。

将数据做成.wav文件压缩上传到谷歌云盘，建一个叫dataset的文件夹，存在里面。这里是EULA.zip.

unzip -d /content/so-vits-svs/dataset_raw {ZIP_NAME}.zip 将该zip文件解压到dataset_raw.

该压缩文件是/content/drive/MyDrive/dataset/kiritan.zip

DATASETNAME，可以修改，但是要和上传存在MyDrive/dataset/下的文件名同名。这里我的dataset下存的是EULA.zip,所以DATASETNAME：EULA。在谷歌盘里，根目录下为dataset/，挂载到Colab是/content/drive/MyDrive/dataset/。

修改完成后点击按钮执行。

命令会将/conntent/drive/MyDrive/dataset/EULA.zip解压缩到/content/so-vits-svc/dataset_raw/EULA/下。现在点击colab最左边的文件，文件结构是这样。

如果要处理不同的角色的声音，只需重新命名，上传，改DATASETNAME就可以了。

这时文件结构会变成：

这个dataset和谷歌云盘里村zip文件的dataset不是一个文件夹。

执行/content/so-vits-svc/preprocess_flist_config.py

生成了/content/so-vits-svc/configs/config.json 用于控制训练时的参数的配置文件。/content/so-vits-svc/filelists/test.txt（测试模型用），/content/so-vits-svc/filelists/train.txt（训练模型用），/content/so-vits-svc/filelists/val.txt（用于测试时，与模型的输出做对比，也就是说，test.txt与val.txt是一样的。）

将数据备份到谷歌云盘。

可能实验不是一天能做完，就可以将上次备份的数据复制过来。

开始训练，第一次训练save_to_drive和pre_pth都要打勾。主要是要用到/content/so-vits-svc/logs/44k/G_0.pth和D_0.pth。以后训练训练出自己的记录点，比如1000steps后得到个G_1000.pth和D_1000.pth，pre_pth就不打勾。可以从该记录点开始继续训练。