欢迎光临散文网 会员登陆 & 注册

语音之家WeNet语音识别实战(第2期)

2023-05-02 21:12 作者:戰億殇  | 我要投稿

首包响应时间

在流式合成中,分段合成的音频会传输给客户端或者播放系统,在合成首段音频时,也会耗费时间,这个耗时称为“首包响应时间”。为什么会统计这个时间呢,因为在语音交互中,根据项目经验以及人的容忍程度,当用户说完话时,在1200ms之内,机器人就要开始播报回复,这样就不会感觉有空白时间或者停顿点


语音之家WeNet语音识别实战(第2期)的评论 (共 条)

分享到微博请遵守国家法律