欢迎光临散文网 会员登陆 & 注册

一切“听”你指挥,语音识别带来沉浸式物联网体验

2020-07-24 09:24 作者:电堂科技  | 我要投稿


1952年,语音识别技术的雏形“Audrey”在贝尔实验室问世。至今,已近80年,这其中有两次技术性突破:一是,2009 年深度学习被系统应用到语音识别领域中,大幅提升识别精度,突破 90%,甚至在标准环境下逼近 98%;二是Amazon Echo 于2015年6月正式面世,它把近场语音交互变成了远场语音交互,不仅引领了时尚生活风潮,还将语音识别技术从对算法不断优化的追求推向多样化应用场景的落地以及更好的用户体验。

▲ 智能音箱带来时尚家居新风潮

多传感融合、大数据、人工智能、物联网等技术不断驱动语音识别的发展,并持续创造着新的应用场景,覆盖智能家居、汽车、客服、金融、教育、医疗多领域。据Tractica数据显示,2017年全球语音和语音识别软件市场规模达到11亿美元,随着人工智能技术的逐渐成熟,市场需求将不断攀升,预计2025年全球语音和语音识别软件市场规模将69亿美元。

▲ 全球语音识别市场不断攀升


从听到、听清到听懂

语音识别主要趋于远场化和融合化的方向发展,但远场可靠性还面临很多难点,比如多轮交互、多人噪杂等场景还有待突破,人声分离技术尚需提高。只有彻底解决这些问题,机器听觉才有可能超越人类的感知能力。这不能仅仅只是算法的进步,需要整个产业链的协同技术升级,包括更为先进的传感器和算力更强的芯片。 从远场语音识别技术来看,存在的挑战包括:

  • 回声消除技术。能否利用深度学习将非线性失真进行拟合,同时结合信号处理手段,可能是一个好的方向。

  • 解决噪声问题。信号处理擅长处理线性问题,深度学习擅长处理非线性问题,两者融合才有可能更好地解决噪声下的语音识别问题。

  • 口音/方言识别。好的声学模型易于识别,如何利用少量的方言数据得到一个好的方言声学模型,这是待解决的难点。

  • 不但听到还要听懂。如何将语音识别和语义理解结合起来,可能是未来更为重要的一个方向。

  • “声光电热力磁”物理传感手段的融合。机器必然要超越人类的五官,能够看到人类看不到的世界,听到人类听不到的世界。

2019年2月,恩智浦推出了全球首款基于MCU的语音控制解决方案,已获得亚马逊Alexa语音服务(AVS)认证。该解决方案可帮助OEM快速、轻松、经济地为其产品添加语音控制,使客户能够使用Alexa获得丰富的语音体验。


这款基于MCU的AVS解决方案采用恩智浦i.MX RT跨界平台,支持低延迟、远场“唤醒词”检测;嵌入了所有必需的数字信号处理能力;在亚马逊的FreeRTOS上运行;包含Alexa客户端应用程序。这是一款经济高效、易于使用的解决方案,可嵌入家庭、商业和工业领域的各种产品,无需部署智能扬声器或智能显示器等独立语音控制设备。

2020年2月,恩智浦进一步推出离线语音解决方案SLN-LOCAL-IOT。该解决方案包含一个完整的硬件模块设计和必要的相关软件,用于通过可自定义的唤醒词和本地命令来实施远场语音控制。该解决方案基于i.MX RT106L跨界微控制器(MCU),可满足广泛的智能家居、商用和工业市场对嵌入式语音控制的需求。


OEM可以利用这款“交钥匙”解决方案大幅降低系统成本并缩短上市时间,为最终用户提供私密、安全、低延迟、无需动手操作的体验。此外,本地语音控制解决方案无需进行复杂、高成本的云连接,并且由于支持直接在设备上处理音频,可以帮助保护用户的隐私。为实现这一目标,恩智浦还与Sonos合作开发了基于机器学习的集成自动语音识别 (ASR)技术。


恩智浦语音识别技术专场直播

2020年8月4日恩智浦语音识别技术专场直播将开播,特邀恩智浦半导体专家为大家讲解基于恩智浦RT106A/RT106L 的语音识别解决方案


 直 播 内 容 

主题:基于恩智浦 RT106A/RT106L 的语音识别解决方案


RT106A/RT106L是一款核心是Arm Cortex-M7, 主频600MHz 的MCU,借助于主频高、成本低、功耗低、外围设备接口简单的优势在多个应用领域完美替代MPU。基于RT106F 开发的面部识别方案,在硬件上可以省去传统MPU+PMIC,替换掉昂贵的DDR, 大大降低产品的整体成本。RT106A可选内置Alexa协议方案,官方认证程序支持云端唤醒,以及亚马逊家庭网络套件。其兄弟产品RT106L是一套低成本的本地语音方案,内置NXP自主研发唤醒引擎,集成Codec,可支持3个麦克风和360°远场拾音。

 

基于RT106A 和 RT106L 的语音识别方案可广泛应用于智能家电,工业控制,智能玩具以及医疗等领域。

 

为方便客户的二次开发,恩智浦准备了完整的开发套件,包括开发主板,摄像头插件,免费易用的开发环境,完备的开发文档以及示例代码。


内容安排:

  1. 基于RT106A和RT106L的语音识别方案及市场攻略

  2. 全新在线和本地语音方案设计

  3. 语音识别参考设计及开发套件

  4. 问答环节

 主 讲 嘉 宾 

王广宁先生担任恩智浦半导体无线充电及物联网方案产品经理,负责无线充电以及物联网产品的定义涵盖消费类,工业及汽车级,市场策略以及产品的培训与管理。

王文生先生担任恩智浦半导体 AI IoT 方案部门系统工程师,负责Voice Solution SDK的代码修复, 软件系统开发及重要客户的技术支持。


 直 播 信 息 

时间: 8月4日14点-16点 


直播奖品 

点击链接,预约直播:

https://nxp.51diantang.com/livedetail?id=9e40de9898e14581a4c91e83f0a57d47


一切“听”你指挥,语音识别带来沉浸式物联网体验的评论 (共 条)

分享到微博请遵守国家法律