玩玩AI语音
上https://huggingface.co/lj1995/VoiceConversionWebUI弄了个AI的语音模型,但是这个作者没写readme,所以折腾了很久才跑起来:
首先是版本,我本地的3.10.6并没有跑起来,换用conda的3.8才跑起来的,其他版本我也不知道能不能行

首先安装库前先确定2件事:
第一:安装vc++:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/
有几个库需要vc++编译源代码
第二:你的setuptools版本必须低于58.0,否则没有2to3的脚本,有几个库安装不了,我这里安装的是57.5.0,如果你是命令行安装则输入pip install setuptools==57.5.0


接下来缺了不少库,一个一个安装:
先按装ffmpeg吧,https://www.ffmpeg.org/download.html,下载到以后把ffmpeg加入PATH,至少要能让找到ffprobe.exe

接下来安装fairseq,gradio,torch,praat-parselmouth
我开始这里就被报错骗了,报错报的找不到parselmouth,结果装上以后告诉我找不到Sound方法,后来在https://github.com/innnky/so-vits-svc/issues/73发现了一个跟我一样被坑的人
接下来还有两个地方的源代码要修改:
第一个:
把urllib的__init__.py里加上from urllib.parse import quote
如果已经有from urllib import quote,则把这句改成from urllib.parse import quote

第二个:
我搞忘了是哪个文件了,运行到这里的时候会有个地方的
报错,你跟进报错的文件,把这里修改成:
即可
接下来不出意外的话就可以运行起来了,直接运行infer-web.py,

然后等一会会出现一个url,我这里是http://127.0.0.1:7860/,进去以后就可以看到它的webui了

接下来就可以愉快的玩耍了,没有n卡的话稍微慢一点,但是也不会特别慢,我这里5600X频率4.6G一首歌大概需要220秒