ai应用小技巧,语音合成
语音合成MocKingBird的安装方法:
安装装备:
python安装,
python环境要求大于等于3.8,安装包下载地址:https://www.python.org/
在进行pyton安装时,需要为python设置环境变量,即将下在“ADD python to PATH”前打勾,

安装,官方下载地址:https://pytorch.org/get-started/locally/,如果电脑没有独显,那么可以使用cpu运行,在打开光网后,选择你要运行的模式:

上图我选择的安装方式是通过gpu运行,运行的环境在windows上,使用pip命令来安装,最后复制这串命令到你的电脑的终端:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117如下所示:

ffmpeg安装,下载地址:http://ffmpeg.org/download.html#build-windows,下载1后将设置环境变量
将ffmpeg下载到本地后,解压得到:

然后为其设置环境变量,右键桌面上的“此电脑”,点击“属性”,

通过高级系统设置进入后台设置:

点击环境变量,进入下一界面

这里选择path,然后进入界面,然后点击新建

将刚刚ffpeg的路径粘贴进来

下载安装MockingBird开源项目:下载地址:https://github.com/babysor/MockingBird
通点击上面官网,进入网页,选择“code”,然后点击“download zip“,

随后解压,即可。、
打开刚才的开源程序包,选择requirements.txt点击进入,这里将
monotonic-align==0.0.0.3改为,1.0.0.0然后保存,

安装visual studio installer,
下载地址:https://visualstudio.microsoft.com/downloads/
将应用安装完毕后,打开页面

这里选择修改,进入页面后在“使用C++的桌面开发”和“通用windows平台生成器”前打勾,然后点击“修改”即可

安装依赖,
pip install -r requirements.txt
待依赖安装完毕后,在输入以下命令
pip install webrtcvad-wheels 来安装webrtcrad-wheels
·,
下载模型
通过网盘链接下载地址:
链接:https://pan.baidu.com/s/1u88jAs_ZhuSr5PhQz07Pyg?pwd=dfds
提取码:dfds
下载一个语音模型,模型下载完毕后把它放置在以下1路径中,
C:\Users\XIAXIA\Downloads\Compressed\MockingBird-main\data\ckpt\synthesizer
运行应用程序
随后打开文件MockingBird-main所在位置,然后运行以下命令:python web.py得到下图所示的页面

这里将地址http://192.168.43.90:8080复制下来然后在浏览器中打开得到下图所示页面

在文本内容框中输入你需要合成的语音,在“或上传语音”中选择你需要克隆的声音,
随后点击“synthesize(合成)”按钮,如下图所示:

程序运行后的画面如图所示:
点击左侧的播放按钮,就可以实现语音的合成功能。