欢迎光临散文网 会员登陆 & 注册

类似D-ID的免费开源虚拟数字人制作工具SadTalker搭建教程及效果演示

2023-04-14 16:44 作者:恺哥笔记  | 我要投稿

大家好,我是佳恺,最近在研究数字人生成项目,发现了一个叫SadTalker的项目,可以用一张图片生成数字人口播视频,这两天在本地搭建好环境测试了下

先看下生成效果,后面再讲搭建和使用方法(多视频预警)

生成效果演示:

输入图片:

生成效果:

因为ai驱动会改变口形眼神,有时候跟原图看起来不太像,但是总体来说SadTalker是开源数字人项目里效果比较好的了,特别是他的口形,中文还是比较像的,感觉比D-ID要像一些。

其他方面,比如自然程度,画质比起D-ID要差一些,当然更别说国内几家大厂的收费数字人项目了,他们身体,手势都有,挺像真人的,所以需要自己判断下使用场景。

SadTalker的安装及使用方法:

SadTalker主页:https://github.com/Winfredy/SadTalker

安装步骤:

1、安装NVIDIA cuda11.3

安装方法看这篇文章:
https://blog.csdn.net/zzjcymbq/article/details/125040993

注意不要这篇文章最后一步 pytorch配置,后面在“项目下载和运行环境配置”会安装pytorch


2、安装 anaconda

由于这个项目是python开发的所以需要先安装一个方便管理python版本的工具

anaconda安装方法可以看这篇教程:https://blog.csdn.net/qq_45344586/article/details/124028689


3、项目下载和运行环境配置

(1)下载文件并解压

因为github以及相关模型直接下载会比较慢,我打包上传到百度网盘了

项目源码百度盘:

https://pan.baidu.com/s/1_2qdL8OAFO-RBrtBpicAqQ?pwd=sm6w

从网盘下载后解压到电脑某个盘,这里举例就下载解压到D盘了

(2)命令行安装

点击开始菜单找到前面已经安装好的 Anaconda Prompt


挨着输入下面的命令,注意“#”后面的文字是注释,不要在命令行里输入

每一行命令输完后按回车,有的步骤安装过程比较久需要耐心等待,有几步安装过程中会询问是否安装,需要输入 “y”确认



在刚才的命令行工具里输入命令查看虚拟环境路径

把SadTalker源代码里面的:

gfpgan\weights\GFPGANv1.4.pth 

剪切到虚拟环境的

Lib\site-packages\gfpgan\weights 目录下


举个例子:

我的虚拟环境就是截图红框路径,所以需要把gfpgan\weights\GFPGANv1.4.pth 剪切到虚拟环境的  D:\ProgramData\Anaconda3\envs\sadtalker\Lib\site-packages\gfpgan\weights 这个目录下


提前准备好语音文件和一张图片,这里假设你已经准备好语音和图片了(需要做某个人物声音的,可以用相关的声音克隆项目克隆声音,空了我再写一篇声音克隆的教程)

把语音文件放到

SadTalker\examples\driven_audio 目录下

把图片

放到SadTalker\examples\source_image 目录下


1、基础使用命令

然后输入下面的命令



等待执行完成后,就可以在SadTalker\results下面的文件夹里面找到生成的结果了

效果如下:


首先看下相关参数:


细心的同学可能会发现一个问题,上面的基础使用,用到的图片是一张半身照,但是生成的视频是只有头部了

对,这个是需要参数控制的,接下来我们加上--preprocess full 和 --still这两个参数

--preprocess full 表示完整图片

--still 可以减少头部运动

第一个参数好理解,为什么会有第二个参数呢? 

原因是,项目在用完整图片生成视频的时候,头部在动,但是肩膀会保持不动,交接处就会产生比较扭曲的现象

加上--still后就可以防止交接处扭曲,但是整个视频就几乎只有眼睛和口型的变化了,看起来没那么自然。

其他参数,也可以自己试一试。


整体来说,对质量要求不那么高的场景,SadTalker还是能用一用,毕竟是免费的。然后参数的话想要自然就用基础命令,想要完整图片生成就加上那两个参数。

最后这个环境如果是小白,搭建其实还是比较麻烦的,我想的是租一台云服务器,然后搭建好webui版的,大家可以直接上传语音和图片直接生成,甚至可以把语音克隆功能也搭建好。

最后,对数字人制作感兴趣的小伙伴可以留言或者加我交流


再来几个演示:


类似D-ID的免费开源虚拟数字人制作工具SadTalker搭建教程及效果演示的评论 (共 条)

分享到微博请遵守国家法律