欢迎光临散文网 会员登陆 & 注册

有奖调查 | 召唤KWS/ASR爱好者

2020-06-24 09:10 作者:电堂科技  | 我要投稿


参与KWS\ASR (关键词唤醒\语音识别)调研赢奖品


今天,你有没有跟手机上的Siri玩成语接龙?下班回家后,你家的Echo有没有热情地欢迎你回来?

不知不觉中,AI已经深入到我们生活的方方面面,而语音交互成为最基本最直接的AI控制方式。语音交互生态的成熟,将会带动越来越多的设备语音化、智能化,使语音真正成为人机交互的界面。


语音识别,云端还是终端

语音识别技术是指机器自动将人的语音的内容转成文字,又称 Automatic Speech Recognition,即ASR技术

语音识别方案主要有三大部分组成:语义识别平台,CPU主控,以及MIC(麦克风)阵列

当前主流的语音识别方案是在终端上进行声音采集和前处理,语音识别算法则放在服务器(即云端)上运行。这是因为作为CPU主控,目前嵌入式终端上的CPU性能还不够强劲。这种方案有泄漏隐私(把终端上的语音数据发给服务器)和无网状态不能使用等缺点。随着终端CPU性能日益强大,未来的语音识别所有功能都能够终端上实现。


关键词唤醒,可以在终端

不过,目前我们也不用消极等待。关键词唤醒功能(Key-word-spotting, KWS)是可以在终端上实现的。关键词唤醒是指设定一个唤醒词,如Siri的“Hi Siri”,只有用户说了唤醒词后,终端上的语音识别功能才会处于工作状态,否则处于休眠状态。这样做主要是为了降低功耗,增加续航时间。所有的手持设备对功耗都很敏感,绝不可能让语音识别功能一直处于工作状态。

ST已经和中国合作伙伴OpenAILab一起,将算法移植到了STM32L4、STM32F4、STM32F7和STM32H7平台上。下面的视频就是基于STM32L496的探索开发板。近场模型标准版只需要占用STM32L4 12MIPS, 200kB的Flash和26kB的RAM。

▲  NF模型及指标性能

    蓝蝴蝶粉们,你们是不是也已经开始了关键词唤醒\语音识别的探索?你们手头的方案使用什么硬件平台?接口是怎样的?面向什么有趣的应用?同为KWS\ASR的狂热爱好者,我们对你有很多问号。

为了更好地了解开发者需求,我们特别发起此次KWS/ASR (关键词唤醒/语音识别) AI专项调查。 本次调查问卷对象包括但不限于跟语音识别应用相关的客户,仅需要几分钟,即可完成。您的反馈将为我们提供非常有价值的信息,可以帮助我们进一步改进STM32产品及服务。

活动时间:2020年6月24日-7月5日

活动礼品:32L496G探索板 10块,小米移动电源10个


请扫码参与问卷调查。

关注微信公众号“STM32”了解最新信息



有奖调查 | 召唤KWS/ASR爱好者的评论 (共 条)

分享到微博请遵守国家法律