基于so-vits AI花臼配布(附推理教程)
因未获得授权,已将ai花臼撤下,请拥有模型的人不要传播
AI花臼是基于sovits的歌声音色转换模型,原项目地址:
innnky/so-vits-svc: 基于vits与softvc的歌声音色转换模型 (github.com)
共两万条语音素材,使用Telsa P4训练35h,效果已经尚可
下载地址:ai_usu.7z
前置环境:python3.9(所需库包含在压缩包内requirments),Visual Studio(编译所需依赖库),VSCode(或其他编辑器)
内存大于8g的电脑
所需素材:干净,无杂声的人声素材
以下是推理教程

1.安装Python
可以在如下网站安装python:Python Release Python 3.9.11 | Python.org

选择你的系统版本,Windows用户选择Windows Installer(64bit)
安装时勾选Add to path(如图),然后点击install now

2.安装依赖库
1.安装C++编译工具
方法一:首先安装Visual Studio
下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux (microsoft.com)
仅需安装c++相关工具
方法二:安装VC++
solved_packageMissInInstalling_mu_visual_cpp_build_tools_2015_update_3_x64_dvd_dfd9a39c.iso
打开,双击exe文件(由于微软问题,安装前可能需要切断网络,如果准备长时间卡在准备依赖库则需要断网安装)
2.安装依赖库
解压下载的压缩包,在里面右击空白处,选择在终端打开(如果你是旧版本Windows10用户,则按住Shift选择在Powershell中打开),输入以下命令,回车。
python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
3.准备干声
干声素材需要没有音乐声和背景噪音的人声素材,歌曲可以用uvr提取人声(b站有详细教程了)
3.推理
这么麻烦了不知大家还有没有耐心,但已经胜利在望了
将准备好的干声素材放入raw文件夹下
使用编辑器打开inference_main.py(我这里使用VSCode)

clean_names填写你的干声文件名(最好不要有符号)
trans填写音高,按效果调整,保存,执行
最后可以在results文件夹得到合成后的音频
干到这里,恭喜你已经有了一只可以为你说怪话的花臼(bushi)