欢迎光临散文网 会员登陆 & 注册

【技术分享】AI数字人实时互动直播技术:技术流程介绍

2023-05-18 16:02 作者:Siyuejiang  | 我要投稿

实时抓取用户互动输入文字

输入LLM

语音合成(将文本转化成语音)

合成语音后输入下一个环节对话的生成(表情、口型、动作)audio2motion/audio2lip/audio2motion

传入渲染系统UE5(表情/动作驱动、字幕渲染、场景/形象渲染、毛发/布料结算、编码推流)

OBS 通用推流软件

延迟在对话系统,3s左右,推流延迟和设备/网络相关,1-10s




【技术分享】AI数字人实时互动直播技术:技术流程介绍的评论 (共 条)

分享到微博请遵守国家法律