欢迎光临散文网 会员登陆 & 注册

玩玩AI语音

2023-03-02 13:24 作者:橘里橘气橘子花  | 我要投稿

上https://huggingface.co/lj1995/VoiceConversionWebUI弄了个AI的语音模型,但是这个作者没写readme,所以折腾了很久才跑起来:

首先是版本,我本地的3.10.6并没有跑起来,换用conda的3.8才跑起来的,其他版本我也不知道能不能行

首先安装库前先确定2件事:

第一:安装vc++:https://visualstudio.microsoft.com/zh-hans/visual-cpp-build-tools/

有几个库需要vc++编译源代码

第二:你的setuptools版本必须低于58.0,否则没有2to3的脚本,有几个库安装不了,我这里安装的是57.5.0,如果你是命令行安装则输入pip install setuptools==57.5.0


接下来缺了不少库,一个一个安装:

先按装ffmpeg吧,https://www.ffmpeg.org/download.html,下载到以后把ffmpeg加入PATH,至少要能让找到ffprobe.exe

接下来安装fairseq,gradio,torch,praat-parselmouth

我开始这里就被报错骗了,报错报的找不到parselmouth,结果装上以后告诉我找不到Sound方法,后来在https://github.com/innnky/so-vits-svc/issues/73发现了一个跟我一样被坑的人

接下来还有两个地方的源代码要修改:

第一个:

把urllib的__init__.py里加上from urllib.parse import quote

如果已经有from urllib import quote,则把这句改成from urllib.parse import quote

第二个:

我搞忘了是哪个文件了,运行到这里的时候会有个地方的

报错,你跟进报错的文件,把这里修改成:

即可

接下来不出意外的话就可以运行起来了,直接运行infer-web.py,

然后等一会会出现一个url,我这里是http://127.0.0.1:7860/,进去以后就可以看到它的webui了

接下来就可以愉快的玩耍了,没有n卡的话稍微慢一点,但是也不会特别慢,我这里5600X频率4.6G一首歌大概需要220秒

玩玩AI语音的评论 (共 条)

分享到微博请遵守国家法律