施努卡: 3D机器视觉为什么难普及?
著名心理学家赤瑞特拉(Treicher)曾经验证过一组数据,人类获取的信息83%来自视觉,11%来自听觉。显然,要实现机器智能,迈向智能化时代,视觉信息非常关键,特别是3D视觉。
比如今年最火的元宇宙,要将现实世界在虚拟世界实现映射,需要与3D视觉密切相关的XR。VR在2015年迎来了投资热潮,随后的2016年,被称为“VR元年”。
当时VR设备的眩晕感以及内容不够丰富等原因,让2016年没能成为“VR元年”。直到2021年,Meta售出了1000万台VR头盔Oculus Quest 2,被业界认为XR又迎来了新的爆发期。
自动驾驶汽车和智能机器人也是典型需要3D视觉的领域,但也各自面临挑战。自动驾驶汽车领域,采用纯2D视觉方案,无论是摄像头还是激光雷达,需要海量数据,成本挑战巨大。机器人中所需的3D视觉技术,也因为技术和开发难度限制难以大量应用。
拥有3D视觉领域丰富经验的银牛微电子联合创始人兼副总裁何火高指出,“3D视觉不只是单纯和芯片或算法的问题,还涉及到相关的光学、结构、散热等问题,加上芯片、算法构成的复杂技术系统,使3D视觉的芯片和解决方案有非常高的技术门槛,需要投入更多时间、技术、人才。”
“一个好的技术和一个成功的产品最终能否推动整个生态去发展,中间有巨大的鸿沟,这个鸿沟可能90%是软件的工作量。”白逸进一步表示,“只有提供完整的系统级解决方案,才能满足市场需求。我们也相信双目3D视觉会把整个人工智能机器视觉的成本降低。”
技术的高门槛,也让这一领域只有少数拥有极强技术和产品实力的公司,这阻碍了3D视觉技术的快速普及。一个很好的例子就是苹果以3.6亿美元收购了以色列3D芯片公司PrimeSense,并申请了专利,在iPhone上实现了3D人脸识别Face ID功能,其它厂商由于没有类似的技术和产品供应商,很难在手机上实现如同苹果的3D识别功能。
在XR、自动驾驶汽车和智能机器人领域,市场上迎来了一款融合多种功能的3D视觉感知AI芯片,可能带动3D视觉在这些领域的爆发。