POLY博诣如何让远程沟通高效顺畅?
智慧生活从点进【惠普】哔哩哔哩开始,欢迎大家!惠普哥在这里恭候多时啦,想知道更多产品背后的研发细节?想了解更多科技生活可能?
从本月起,惠普哥将会定期开设科普学院栏目,为大家带来一系列惠普突破性产品技术的深度解读,揭秘产品背后的巧思与妙想,探索科技生活的更多便利与温暖。

在一场“沟通”中,沟通对象双方传递和交换的并不仅仅只有文字信息。这也就是为何我们常常会使用察言观色、言外之意等成语来形容那些隐含在文字和对话之外的信息传递。
一、 沟通中的大部分信息传递,都是非语言性的
早在1872年,英国生物学家查尔斯·罗伯特·达尔文(Charles Robert Darwin)就提出了「非语言沟通」的概念。他认为,在人际沟通过程中,部分信息是「通过非语言途径所呈现的信息」,这其中包括语调、肢体语言等重要部分 。

科技的进步,让远程沟通的需求通过语音、视频通话等方式实现。但远程沟通的效率依然会受到视频或音频设备能力的限制,如画面显示的清晰度问题,环境噪音的干扰,导致沟通双方无法完整的接受对方的全部信息,如表情、肢体语言甚至是语气语调。最后使得沟通成本增加、降低了沟通的效率。
那么有没有什么办法,能够提升沟通效率,让人们的远程沟通更加高效?
二、 POLY博诣如何让远程会议身临其境?
1、 机器识别配合声源定位算法,确保表情动作清晰呈现
POLY博诣将机器学习和音频定位融入摄像头之中,并根据用户使用场景设计独家算法,打造独特的「Director AI技术」,以多个取景模式实现对参会人员表情、动作的真实捕捉,力求将视频会议变得更加高效。

首先,Director AI会利用机器学习算法扫描视野,对镜头画面进行人像头部检测,仅用于识别与会人员的方位、数量等信息,不对人物身份进行识别,而且不做数据存储。这样做,既可以避免人脸信息的数据传输,同时也能提高摄像头的追踪性能。此外,摄像头还会对参会者的位置关系、倾斜程度、真实程度等情景进行实时分析演算,尽可能地不遗漏任何一个与会者。
此外,POLY博诣还会在特定模式配合专门的声源定位算法(SSL)识别声音方位和来源阵列,以协同配合锁定发言人、并调用摄像头进行取景,来实现更为精准的视频切换与追踪。
声源定位算法(SSL)会采用专有的拾音单元计算出声音来源位置,同时基于头部数据、声音等关键因素进行综合判断:如果捕捉到的数据是较倾斜的侧面人脸,算法会判定为此人不在会议中或不属于重要发言位置,则不会对此侧面人脸画面进行拾取并传输给远端;如果捕捉到的是正面人脸,算法则会自动锁定正面人脸并将画面传递给远端。
正是通过Director AI技术的多种取景模式,使得摄像头更加智能,犹如有一位导播在对会议进行实时操作和画面切换,带给用户更加智能化、平等的会议体验。
以群组取景模式为例,POLY博诣摄像头先会基于模式识别算法识别出不同人脸,并给予不同大小的识别框。这些识别框,会用于进行画面的传输和裁剪。

其中,绿色框内的人脸是POLY博诣摄像头判断的中心,而蓝色框内则是设备输出给远端的实际图像画面,蓝色框会基于绿色框内人脸的实时变化而进行变化,这样能让所有与会者保持在画面中央,进而展现更加清晰的与会者画面。摄像头还会根据与会者人数自动缩小或者放大画面。
在「人物取景」模式中,POLY摄像头可以将同一画面的几位与会者分为独立的单个画面传送给远端,也可以将独立的个人画面合成一个画廊。举个例子,一共有5个人参与了远程视频会议,但由于屏幕的限制导致与会者无法看清每个人,这时候摄像头给会议室中的每一位参与者特写镜头,并通过技术处理,将所有特写镜头的画面放在一个画面中。

根据不同的使用场景,用户还可以设置将单流画面分成多流画面,让处于同一空间、共享一个摄像头的不同参会者也能以不同用户的身份参与到会议中。
此外,POLY还推出了专门的「发言人追踪」模式,发言人取景与发言人追踪模式所用到的声源定位算法原理类似,但也有所区别。发言人取景模式下,声源定位算法会实时检测声源位置;发言人追踪模式下,算法会周期性地检测声源的位置,如果出现无人发声的情况,将锁定当前识别的人脸画面并且进行追踪。这也是发言人追踪模式的特别之处,主讲人就算不出声、只是进行肢体移动,摄像头也不会丢失追踪焦点,确保时刻聚焦的出色视频体验。

2、拾音魔墙(Acoustic Fence)加持,真实传达语音语调

POLY不止聚焦于视频技术的精进,针对声音传输环节,POLY早在7-8年前就推出了拾音魔墙Acoustic Fence功能。拾音魔墙Acoustic Fence功能通过排列主麦克风和Fence麦克风的位置,再用算法识别用户周围的声音,对有效声音进行拾取、对噪音进行过滤。这就像为用户竖起了一堵隐形的噪音屏蔽墙。
拾音魔墙Acoustic Fence的主麦克风负责拾取收音范围内的音频并进行传输,Fence麦克风则负责接收环境噪音、将围栏外的声音进行过滤。在拾音范围内的声音,算法会判定为有效声音,主麦克风会对有效声音进行拾取并传输;针对拾音范围外的声音,算法会对噪音进行有效消除;如同时有噪音和用户的人声,算法会对噪音抑制 – 10~12db,凸显演讲者的声音。用户可以自行设定设备的有效拾音范围,来决定这堵墙的屏蔽区域,以实现个人和团队会议不同的拾音需求。

拾音魔墙Acoustic Fence在不同的设备上的样式也各有差异,比如在音箱产品的Sound Bar上的阵列是自定义扇形,用户可以自行设定扇形的角度,根据使用需求灵活调整扇形的覆盖角度;在更加复杂的会议室场景中采用模块化的会议室解决方案时,可以通过连接多个处于不同平面的麦克风的形式,在空间中打造一个更为立体的复杂的拾音魔墙,以满足对于不同声场环境的适配。
此外,POLY博诣还充分发挥Director AI技术和拾音魔墙Acoustic Fence的协同作用,拾音魔墙可以辅助Director AI进行演讲者识别,帮助其更加准确地识别当前演讲人、给到特写;当Director AI将镜头切换到对应演讲者,拾音魔墙Acoustic Fence的范围也会调整到当前的以演讲者为中心。用户无需手动调整镜头和耳机,算法会自动进行运算和更新。举个例子,用户从一张椅子移动到另一张椅子,摄像头会同步对画面进行切换,拾音魔墙Acoustic Fence也会将隐形隔音墙移动到另一张椅子,将拾音范围外的噪音屏蔽。

3、通过混合式降噪(ANC)技术,让发言者细微的语气也能被听众感知
双向的沟通除了能看能说,还少不了聆听这个重要环节。而这部分,就需要在接收端进行努力。
市面上已经有许多耳机使用「主动降噪」功能。其原理就是通过环境麦克风搜集环境噪音,随后通过扬声器产生一个响度一致、频率相反的音波,来抵消掉对应噪音的音波,实现降噪的目的。

在具体的技术实现上,市面上常见的主动降噪技术(也被称为ANC,Active Noise Cancellation)有三种,分为后馈ANC、前馈ANC和混合ANC。POLY博诣利用其超过50年的远程沟通研发经验,充分将包含办公室、机场等多种环境下的常见噪音考虑在内,精进混合式ANC技术,结合后馈式ANC和前馈式ANC的优点,给用户带来更好的语音通话体验。接下来,惠普哥就简单给大家讲讲,这三种ANC技术有什么不同。
前馈式ANC是将麦克风放在耳机外部,用来搜集耳机外部的全部音频噪音,由于它相对于扬声器处于更外边,可以更早地检测到环境噪声,进行降噪处理,但缺点是无法确认人耳最终听到的是否依然还有漏网的噪声,且只对类似汽车喇叭、婴儿哭声、门铃、钥匙、吹口哨等1-2千赫的噪音起作用。而且在通话时,由于其降噪麦克风位于耳机外侧,很容易将人的说话声也当成噪音进行处理,因此会在耳边听到自己的回音。
而后馈式ANC技术是将麦克风放置于耳朵的一侧,通过检测人耳实际听到的噪音来进行对应的降噪,因此它不会处理那些不会被听到的噪音,相比较而言处理更准确,但缺点是降噪效果和耳机的佩戴准确程度息息相关,且不能处理门铃、钥匙声等超过800Hz的噪音,以及容易让人感受到耳边有杂音。
此外,针对后馈式ANC,虽然麦克风接收到的杂音都来源于耳朵一侧,但它无法分辨究竟是耳朵能听到的声音、还是来源于人在说话时产生的骨骼共振,因此会让人在说话时也会误启动降噪,从而让人反而感觉到耳边总有杂音。
针对前馈式ANC降噪不彻底、后馈式ANC在语音通话时的不足,POLY博诣以其丰富的研发经验,使用混合式ANC技术,改善前馈式ANC和后馈式ANC的缺点,为用户带来更清晰的通话体验。

混合式ANC 麦克风被置于耳罩内外侧,所需的麦克风数量是反馈 ANC 的 2 倍以上,可同时监控用户听到的声音和背景噪音,从而生成相对舒适的降噪声波。在耳机内部,POLY博诣通过专门算法,将人说话时产生的骨骼共振杂音也考虑到降噪音波的生成中,从而降低说话过程中的耳边杂音。此外,耳机外部的麦克风也会同步收集来自外部的噪音来源,两方相合,能够产生相对准确且自然的降噪声波。优质的音频传输,也会减少沟通的成本,提高聆听效率,帮助用户保持专注和高效。
此外,用户还能通过手机APP、电脑客户端对降噪等级进行调整,实现更好的降噪体验。
这就是POLY博诣在实现高效沟通方面作出的努力。如果你也在为远程沟通场景寻找一个趁手外设,那么以下产品,不容错过:
用于个人音频降噪:
【Voyager Focus 2】
https://item.jd.com/100025055636.html
用于团队视频会议:
【Poly Studio R30】
https://www.poly.com/cn/zh/products/video-conferencing/studio/studio-r30
还想知道惠普更多的产品背后的科技与故事?欢迎关注「惠普」官方哔哩哔哩账号、关注「科普学院」专栏,我们下期见~!
<广告>