欢迎光临散文网会员登陆 & 注册

语音之家WeNet语音识别实战（第2期）

2023-05-02 21:12 作者:戰億殇 0人读过 | 我要投稿

首包响应时间

在流式合成中，分段合成的音频会传输给客户端或者播放系统，在合成首段音频时，也会耗费时间，这个耗时称为“首包响应时间”。为什么会统计这个时间呢，因为在语音交互中，根据项目经验以及人的容忍程度，当用户说完话时，在1200ms之内，机器人就要开始播报回复，这样就不会感觉有空白时间或者停顿点

标签：

语音之家WeNet语音识别实战（第2期）的评论 (共条)