so-vits-svc环境安装和AI训练
今天把笔记本电脑重装了系统,顺便重新弄了一遍so-vits-svc,过程非常折磨。。。

so-vits-svc项目地址:
https://github.com/innnky/so-vits-svc (原作者已经删除了代码)
基于vits与softvc的歌声音色转换模型
作者:innnky

2023年3月30日更改
由于很多人的对项目的滥用,原作者已经删除了项目。。。
不过还能GitHub上找到备份:
https://github.com/svc-develop-team/so-vits-svc
该项目目前由So-VITS社区维护。不知道后续会不会有更新

2023年3月30日补充:
特别注意:
1.版权问题一定要认真对待。
2.可以用自己的声音训练,这样不容易遇到版权问题。(要注意原曲的版权问题)
3.不要直接用别人的mv作为背景,最好自己制作。(比如用AI生成的图片或者视频)
4.不要制作对题材相关人员有伤害的内容。(声音来源和原唱不希望出现的内容)
5.既然原作者选择删除项目,那么后续再投稿就不要再带上作者和原项目地址了,除非你解决了所有版本问题而且没有伤害性内容。(滥用已经对原作者产生了困扰)
6.遇到问题,可以在评论区找一下有没有类似的情况。
7.训练好的模型文件不要分享出去。

我的硬件配置如下:
CPU
Intel(R) Core(TM) i7-10870H CPU @ 2.20GHz
GPU
NVIDIA GeForce RTX 3070 Laptop GPU 8G显存
AI的硬件需求主要在显卡这一块。
我的这个显卡是笔记本的3070 8G显存。刚好够用的水平。。。

我把折腾的过程整理了两个文档,文档我放在百度网盘了。

2023年3月30日更改
环境依赖安装.doc 链接: https://pan.baidu.com/s/1WS8d8zgQD5HhJcgZB4YE0Q?pwd=np93
训练AI.doc 链接: https://pan.baidu.com/s/1mBhXv3xWLgt_L-Vn8x0I6Q?pwd=cd3h
制作文档的时候,还是3.0版本。
现在推荐用4.0版本,大幅优化了显存占用,8G显存已经可以直接推理一整首歌了。步骤都是差不多的,文档还有参考意义。

环境依赖安装.doc 包含了以下章节:
主要记录了需要安装的各种环境和依赖。
Cuda
Python
项目依赖
Pytorch
ffmpeg
git(可选)
vscode (推荐)
训练AI.doc 包含了以下章节:
主要讲解了训练这个AI的步骤和一些注意事项。
下载代码
预训练模型
准备数据
数据预处理
开始训练
日志文件
中断和继续
这两个文档只是记录了训练AI的步骤
对于AI的使用,我后续会出一个视频介绍怎么进行歌声音色转换
2023年3月30日补充
怎么进行歌声音色转换,可以参考这个视频。
视频当时还是用的3.0版本。推理的时候还需要把一首歌切成几个小段,再把结果拼接起来。
现在的4.0版本已经对显存占用进行了优化,可以直接推理一整首歌了,不需要切片。

简单来说就是把A唱的歌转换成B的声音。

这个视频就是把周杰伦的声音转换成了我自己的声音。



