解决aki秋叶整合包SD安装sd-wav2lip-uhq遇到的各种问题

最近在WIN11里使用秋叶SD整合包遇到了安装sd-wAV2lip-uhq插件启动SD屡屡出问题导致无法使用,例如提示pip安装insightface无法编译,启动git+https://github.com/suno-ai/bark.git一直报错,wAV2lip点击生成后报错等。
在SD的扩展中安装完sd-wAV2lip-uhq插件,启动SD,No module named 'insightface' ,一般会说缺少insightface库,单独在命令行中pip install insightface进行安装,这是一个python的人脸识别插件,安装需要依赖C++的编译工具。一般终端会提醒你需要到https://visualstudio.microsoft.com/downloads/下载VS开发工具,按网上的教程下载,估计需要6个多GB的空间占用,哭晕了要。
但老外给了一个比较好的方案,你需要先到前面的网址下载vs_buildtools.exe,在exe文件所在目录的命令行中复制粘贴回车自动安装需要编译的依赖工具就好,大概也就1个多GB大小:
vs_buildtools.exe --norestart --passive --downloadThenInstall --includeRecommended --add Microsoft.VisualStudio.Workload.NativeDesktop --add Microsoft.VisualStudio.Workload.VCTools --add Microsoft.VisualStudio.Workload.MSBuildTools

安装完C++编译环境后,重新命令行运行pip install insightface,则可以顺利安装。
另外再次启动SD可能还会告诉你缺少什么库,你就用pip继续安装。
2.此外还有两个模型文件会告诉你丢失,无法下载。一个是detector.onnx,一个是classes。
目录地址:C:\Users\[替换你的用户名]\.ifnude
到https://www.123pan.com/s/ueDeVv-Xp0I.html,下载拷贝即可,如下图。

3.启动终端遇到了git+https://github.com/suno-ai/bark.git一直报错
Failed to connect to github.com port 443: Timed out

怎么解决?打开命令行关闭掉SSL验证即可。复制粘贴回车,git config --global http.sslVerify false

命令行输入:git clone https://github.com/suno-ai/bark.git

命令行输入:pip install bark --prefer-binary

最后,你的AKI秋叶整合SD的终端启动状态应该是如下的信息,说明成功咯。

但启动sd-wAV2lip-uhq的时候,可能你会遇到以下错误,
Using cuda for inference.
Reading video frames...
Number of frames available for inference: 478
(80, 1807)
Length of mel chunks: 598
就卡死不动了。


这个时候你关闭掉控制台,在命令行中运行:pip install librosa==0.8.0

安装完毕后,重新打开控制台,就可以运行,执行速度稍微有点慢,刚开始我以为又卡了,结果等待1分钟左右就出现了继续执行的进度条,RTX3060 12GB的显卡。

运行期间会检查对应的模型是否有安装,否则还会报错哦,这个时候,你就需要根据上图右侧的路径,下载模型,放到相应的目录。
WAV2Lip
https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/Eb3LEzbfuKlJiR600lQWRxgBIY27JZg80f7V9jtMfbNDaQ?e=TBFBVW
WAV2Lip + GAN
https://iiitaphyd-my.sharepoint.com/:u:/g/personal/radrabha_m_research_iiit_ac_in/EdjI7bZlgApMqsVoEUUXpLsBxqXbn5z8VTmoxp55YNDcIA?e=n9ljGW
s3fd
https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth
landmark predicator
https://github.com/numz/wAV2lip_uhq/blob/main/predicator/shape_predictor_68_face_landmarks.dat
重新运行控制台,执行生成,应该就不会出现问题咯。

完成执行并成功导出mp4的界面!

讲真,这种数字人的技术,结合换脸,克隆声音等,用的不好,就容易侵权或者用于诈骗,所以希望大家合法的使用,不要乱来哦。最后,如果能解决各位使用sd-wAV2lip-uhq遇到一些问题,麻烦一键三连哦,写文章不易,支持原创人。


