玩玩AI语音

2023-03-02 13:24 作者:橘里橘气橘子花 0人读过 | 我要投稿

上https://huggingface.co/lj1995/VoiceConversionWebUI弄了个AI的语音模型，但是这个作者没写readme，所以折腾了很久才跑起来：

首先是版本，我本地的3.10.6并没有跑起来，换用conda的3.8才跑起来的，其他版本我也不知道能不能行

首先安装库前先确定2件事：

第一：安装vc++：https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

有几个库需要vc++编译源代码

第二：你的setuptools版本必须低于58.0，否则没有2to3的脚本，有几个库安装不了，我这里安装的是57.5.0，如果你是命令行安装则输入pip install setuptools==57.5.0

接下来缺了不少库，一个一个安装：

先按装ffmpeg吧，https://www.ffmpeg.org/download.html，下载到以后把ffmpeg加入PATH，至少要能让找到ffprobe.exe

接下来安装fairseq，gradio，torch，praat-parselmouth

我开始这里就被报错骗了，报错报的找不到parselmouth，结果装上以后告诉我找不到Sound方法，后来在https://github.com/innnky/so-vits-svc/issues/73发现了一个跟我一样被坑的人

接下来还有两个地方的源代码要修改：

第一个：

把urllib的__init__.py里加上from urllib.parse import quote

如果已经有from urllib import quote，则把这句改成from urllib.parse import quote

第二个：

我搞忘了是哪个文件了，运行到这里的时候会有个地方的

报错，你跟进报错的文件，把这里修改成：

即可

接下来不出意外的话就可以运行起来了，直接运行infer-web.py，

然后等一会会出现一个url，我这里是http://127.0.0.1:7860/，进去以后就可以看到它的webui了

接下来就可以愉快的玩耍了，没有n卡的话稍微慢一点，但是也不会特别慢，我这里5600X频率4.6G一首歌大概需要220秒

标签：

玩玩AI语音的评论 (共条)