XR产业加注“核燃料”,加速在即
一、前言
2022一开年,美国加息、疫情加码、俄乌大战,美股、A股持续下跌。股民的心啊,那叫一个拔凉拔凉的。

随着股市的低迷,很多投资者对于XR(AR/VR/MR)的信心大打折扣,最近球友们经常来问警长的动态。警长呢,最近挺开心。为啥?因为警长持有的歌尔股份,主业务是XR产业,而2022年XR产业将被注入“核燃料”,加速成长。这歌尔本来有点贵的价格,最近因为市场一通乱棒给打了下来,给了警长不错的加仓机会。嘿嘿。今天警长就和大家聊聊这个“核燃料”。
2021年,在Meta公司的推动下,VR产业首次迈过千万台发货量门槛,意味着XR产业已经走出“第二曲线”的低谷期,正式进入了第二曲线的增长区间。
而2022年,一项曾经用于军事及工业领域的黑科技即将走向普通消费者,而这也将为XR产业的发展注入“核燃料”。2022年,将有4款新上市主流XR眼镜,分别是Meta Cambria、索尼PS VR2、苹果MR以及字节的 Pico 4 Pro,而它们,全都不约而同的都加注了“核燃料”:眼动追踪。

二、什么是眼动追踪
眼动追踪顾名思义就是追踪眼睛的运动。严格来讲就是通过图像处理技术,定位瞳孔位置,获取瞳孔中心坐标,并通过某种方法,计算人的注视点,让电脑知道你正在看什么。
眼动追踪技术最早用于军事领域,如美军F35战斗机的飞行员头盔。通过眼动追踪技术,飞行员只需要用眼睛就能够瞄准敌方导弹。而这个头盔的价格高达40万美元。是的,你没有看错,单位不是人民币,是美元。

随着技术的不断发展,微软在其AR眼睛HoloLens2上也应用了眼动追踪技术。但由于HoloLens2的价格高达2.7万元(乞丐版2.7万,高配版更贵),目前也仅仅用于工业与军警领域。

三、眼动追踪技术的独特价值
1.注视点渲染:令眼镜更轻、更强、效果更好
由于人眼的独特构造,实际上只能看清注视点的图像,注视点外围的图像天然是看不清的。而目前的XR产品,在对图像进行处理和渲染时,不区分位置,对整幅图像进行全局渲染。这样就需要非常强大的计算单元,同时功耗更高,发热更大,待机更短,重量更重。

当XR使用了眼动追踪技术后,就能够识别人眼的注视点位置,那么计算单元只需要计算渲染注视点位置的图像(注视点渲染技术)。对于注视点外部的图像,则可以减少计算量。这样一来就能够大幅减少运算量,进而令XR的发热更小、功耗更低、待机更久、重量更轻。
2.眼神还原:为社交注入灵魂
人类视觉(由大脑驱动)天然对人脸敏感,而最为敏感的区域为眼睛。这也是我们说眼睛是心灵的窗口的原因。大家可以想一下,如果要与人进行重要的沟通,无论公事私事,都希望真人现场对话,也就是我们说的“面对面”。而面对面的核心是看到对方的表情,核心的核心是看到对方的眼神。无论是夫妻之间、朋友之间、家长与子女之间、领导与下属之间,谈判对手之间甚至警察与罪犯之间,当进行重要的交流时,眼神交流不可或缺。
而传统IT技术,无法高度还原眼神。以我们目前常常使用的视频通信为例,虽然现在我们使用远程视频(比如微信视频)能够看到对方的图像,但是这个图像实际上是一个第三人称视角。而且对话双方是无法感知到相互间的位置的,你无法主动“靠近”对方,对方也无法“靠近”你。而在面对面交流的过程中,人类不仅是在观察对方的眼神,也能够通过自身的移动,来进一步识别、确认对方的眼神。当然了,传统视频通话时,你也可以一边远程视频,一边和对方说:“你,靠近一下摄像头,对,就这样,好,再近一点,让我看看你的眼神”。想象一下,如果这样,就已经失去了眼神交流意义。眼神交流,更多的是在语言交流之外,看似不经意间的交流。
再举个栗子,各种竞技类运动中,人类一样需要感受对方的眼神,比如说乒乓球。在打球的过程中,通过观察对手眼神可以了解对手战术意图。如果比赛打赢了,双方也会情不自禁的观察对方的眼神,对方到底是骄傲、懊恼、愤怒、无奈还是其他心情,眼神最为直观。
目前在VR运动类游戏中有个比较火的游戏就是VR乒乓球。这个游戏可以直接进行真人对战,对战过程中可以一边打,一边聊天,就像下图一样。

这个游戏的临场感非常强,不仅是挥拍、击球等等动作的临场感好,而且在打球过程中能够直接看到真人对手的“化身”。真人怎么动,化身就怎么动。但目前游戏只能看到对方的人头和两只手,看不到对方的眼神。如果VR眼镜使用了眼动追踪技术,那么“化身”可以同步真人的眼神,临场感即可进一步大幅提升。
有了眼神后,VR乒乓球甚至会比真实的乒乓球让人感觉更好。为什么呢?如果是真人,那是直接能看到对方的脸的。对于社交牛逼症患者,这当然不是个问题。但对于大量宅男宅女来说,当然是希望先不要以真面目示人。而VR,不仅很好的同时满足了社交的需求,又能够有效且自主的控制“社交浓度”。你可以选择完全还原你的脸,还可以选择美化你的脸,当然也可以将你的脸替换为卡通形象,比如王者荣耀里的妲己。这样,一来实现了社交,二来还可以保护自己的隐私,第三还能增加互动的主题(比如腾讯可以举办一个王者荣耀杯VR乒乓球比赛,头像全部用王者的各种英雄)。
另外一个例子是FitXR,这是一个非常火的运动类VR APP,这也是警长非常爱玩的一个APP。其内容类似于健身俱乐部提供的各种私教课。以拳击操课为例,“教练”一个班上带7个学员。每节课15分钟左右,每个动作两三分钟。这都与真实的私教课很类似,但是比私教课更好玩的是,你在做每个动作的时候,你的动作都能够被量化,进而与其他同时练习的学员进行实时排名。运动过程中的动效以及实时排名,能够不停的驱动你更加投入更加标准的完成动作。和真实跳操一样,你也能够看到同时跳操的其它小伙伴,但与上面的VR乒乓球一样,目前也是看不到他们的眼神。试想,当眼动追踪技术实现后,一边运动,一边还能与教练或者小伙伴眼神交互,是不是能够让运动更加真实,更具社交性?

第三个例子是虚拟主播。2021年6月,B站CEO陈睿在B站12周年庆上表示,虚拟主播已成为B站直播领域增长最快的品类。过去一年,一共有32412名虚拟主播在B站开播,同比增长40%。直播弹幕互动量达5.6亿,同比增长100% ;虚拟主播投稿量达到189万,同比增长50%;虚拟主播稿件播放量达83亿,同比增长70%。而现在,以非VR技术,还原眼神所需的软硬件投入在300万元以上,因此当前B站上的虚拟主播极少能够实现眼神还原。试想,一旦VR加入了眼球追踪与眼神还原,那么首先大量的B站主播小姐姐必然会配置上这个新的神器。而同时,也许手机看到的小姐姐视频与以前差异不是太明显,但如果观众使用VR眼镜,则可以第一人称视角与心仪的小姐姐互动。这时的互动已经不是简单的语言文字,而是小姐姐的眉目传情与暗送秋波。为了这种超越二维世界的体验,死肥宅们会不会冲动消费买VR眼镜,可想而知。

3.新型交互“NPC:你瞅啥?玩家:瞅你咋地?”
上面讲的是玩家与玩家之间的社交与交互。那么我们很容易的可以想到,除了人之外,电脑人(NPC)自然的也就能知道你在看啥。这就给各类的软件交互增加了一个新的输入变量类型。NPC不仅知道玩家的位置信息、动作信息,还能知道玩家在看啥。在游戏中,NPC就能够通过识别玩家的眼神与人进行交互。届时,不管是游戏中的美女、妖怪、大侠还是僵尸,都有可能冷不丁的对你说:你瞅啥?
当然了,前文提到F35头盔用眼睛跟踪导弹的技术,一样可以用在游戏中。对于需要瞄准和击发的游戏类型,瞄准或者击发将不再需要用手才能实现。一个小眼神,就可以瞄准,发射。感受一下……
那时,用眼睛控制的其它的一些交互形式,比如翻页,上下左右控制,有可能会显得很土了,呵呵。
4.大数据变现:你的眼神出卖了你的心
人所接收到的外界信息有80%来自于眼睛所建立的视觉通道,同时人在进行思维或心理活动时会将其活动过程反映在眼动行为上。可以说,眼动追踪技术是当前科技允许的条件下,“透视”人类思维的最为直观有效的途径。
下面这张图是一个“热力图”,是对人眼关注的点的图像化。在VR有眼动追踪之前,得到热力图的方法是:让人佩戴眼动仪(一种可以追踪眼动的专用设备),然后观看电脑。眼动仪记录眼镜观看的位置和时长,最终得到的“热力图”。

我们很容易的就能想到,如果是一个广告商,通过这个热力图就能够很直观的分析自己投放的网页广告中,哪些图片或者哪些词句得到了关注。
后面这几个热力图是关于人类对人体的关注点的,很有趣。下面这张热力图显示了人类对人体不同位置的关注度:看脸最多,看胸其次,再次看腰臀。

而下面这张热力图,则显示了男人与女人的不同关注点。男人,看女性胸部的时间比女人多了37%。

下面这张热力图显示,女人看戒指的时间比男人多了27%。

下面这张热力图显示,对于女性脸部,男人更关注嘴唇,而女人则更关注眼睛。

再进一步,还可以分析不同国家女人对胸部的关注度。法国女人最关注胸部,比丹麦、巴西、美国等国家的女人高出一大截。

而男性对女性胸部关注度最高的国家是丹麦和法国。看来,在法国,不管男性还是女性,都爱看胸部。浪漫(荷尔蒙)之都不是随便说说的。

我们把话题从胸部收一收。很显然,眼动追踪能够非常客观的识别用户的关注点。而以往所有的媒体都很难做到如此精准客观的识别与追踪。对于广告投放商来说,眼动追踪简直就是一个大宝藏。巧的是,世界上最大的广告投放商,就是那个每年花一百亿美元巨资,贴钱卖VR的公司:Meta(原Facebook)。是的,Meta之所以能够成长起来,就是因为其对用户的精准识别及精准的广告投放能力。如今,Meta一年收入近1200亿美金,97%都来自广告。但是近年来由于苹果和谷歌的对隐私政策的不断收紧,Meta的广告投放精准度逐渐受限。如果一直限制下去,小扎的命不久矣。而一旦从既有的手机媒体跨越到XR,而且XR的硬件不受他人限制,那么其广告帝国就又能蓬勃成长了。至此,大家应该能明白,扎克伯格不遗余力的发展元宇宙,小九九是早就打好了的。
对用户来说,VR眼镜可能是个游戏机、社交机、运动机,但对于Meta来说,无非就是个“广告机”
下面三张图,是警长去年为某公司定制研究报告时做的。大家体会一下。



四.总结:加注核燃料,仅仅是一个开始
前文说过,Meta、苹果、索尼和字节,都会在今年的新品中加入原生眼动追踪。而由于Meta和字节所具备的媒体属性,可以通过眼动大数据对用户精准识别,进而精准投放,进而获得商业回报。因此Meta和字节两家,在可以预见的两三年内,必然会对其VR产品大规模补贴,以加速其“广告机”的覆盖进度。而据警长交叉信息确认,Meta、苹果和字节三家,不仅每台眼镜会有两颗专门负责眼动追踪的摄像头,而且还会加入至少一颗表情识别(主要是嘴部)摄像头。也就是说,除了眼动追踪这个核燃料外,各大厂商今年也将同步“注入”表情识别。而这两项技术,到2023年将会成为所有主流VR/AR产品的标配。随着能量充沛的“核燃料”注入,XR产业将得到大力助推,一飞冲天。