欢迎光临散文网 会员登陆 & 注册

特斯拉Fsd纯视觉闭环软硬件体系缘由及展望

2023-03-10 10:26 作者:纯视觉摸相  | 我要投稿

3月9日,特斯拉向工信部备案了无雷达的MODEL Y,预示国内特斯拉的软硬件逐渐与北美接轨,特斯拉FSD V11不单是技术上符合进国内条件(视觉实时建图与感知,不依赖地图,详见视频:特斯拉Fsd v11为什么是纯视觉进入国内的关键技术步骤?国内所有特斯拉有望获得与Fsd v11同算法架构的lcc与noa),在监管审批及生产准备层面,也有了实质性的动作。

特斯拉FSD V11.3.1第一视角

车上的传统毫米波与超声波雷达若被移除,只用摄像头,则国内很快就有大家常说的特斯拉“纯视觉”自动驾驶了。国内的自动驾驶市场竞争烈度激增,排除原本的偏见与预设的立场,国内厂家及爱好者应该客观看待特斯拉在AI领域的强悍,正视自动驾驶各技术路线的优劣势,结合自身资源禀赋选择适合自己的道路。

本文尽量用最简洁的语言,回答几个大家最常问的问题:

问题一、什么是纯视觉?

问题二、摄像头、毫米波、超声波、激光雷达、高精地图等传感器优劣势及如何搭配如何?

问题三、各自动驾驶路线的边际成本及投入产出特征如何?

问题四、特斯拉打造的纯视觉闭环软硬件体系,具体有哪些组成部分?

问题一:什么是纯视觉?

答:不依赖高精地图等先验信息来感知与规划行驶路径,不依赖激光雷达来感知交通参与者的速度、位置、距离信息,仅依靠摄像头的视觉信息,就能实时生成由周边道路与交通参与者(包含参与者的深度、距离、速度信息)构成的向量空间。

纯视觉最突出的优点是什么?

答:脱离了高精地图只能在特定区域特定路段使用的局限,避免了视觉信息与雷达信息不一致导致系统熵增的陷阱,利用了视觉信息带宽最大,所含信息最丰富的特点, 充分利用AI技术手段:建立强大的算力,收据最为庞大的(视觉)有效训练数据及仿真数据,快速完善迭代算法。

问题二:摄像头、毫米波(传统或4D成像)、超声波、激光雷达、高精地图等传感器优劣势及如何搭配如何?

答:

1.激光雷达与高精地图是没有必要的(视觉带宽最大,频率高,特斯拉目前的vnn与occupancy network神经网络在数据驱动下,视觉测距测深度高度速度表现己比雷达强,在任何地方都能以每10ms一次刷新地构建包含周边环境所有交通相关信息的向量空间,激光雷达与高精地图的功能己被视觉实现,激光雷达的存在导致系统出现因多传感器的不一致而熵增)

2.并不是说特斯拉做纯视觉就是排斥雷达,而是高清晰度的雷达尚未出现,而低分辩率毫米波因为噪声太大而无法有效利用,在与视觉融合时还会因为降噪需要过滤掉静止物体导致额外的风险。

3.一旦特斯拉有了高清晰度的(4D)成像毫米波,与纯视觉融合是会有帮助的。

个人认为这种帮助主要是因为成像毫米波是主动式传感器,能够与被动接受光线的摄像头形成互补,高清成像毫米波能在特殊情况(如黑夜低光,逆光,浓雾与暴雨,车灯损坏)下充当暂时的主力感知传感器,成为纯视觉的有效冗余备份的存在(而不是激光雷达与视觉的关系:功能及应用场景类似,两个传感器信息不一致时给系统带来熵增,而遇到恶劣天气又同时受影响,详见视频:两分钟了解为什么一骑绝尘的特斯拉纯视觉Fsd选择利用数据驱动算法进化,却不用任何雷达捷径(实为拐杖)的真正原因。)。4D毫米波理论上可以使纯视觉FSD进化为全天侯FSD。

问题三:各自动驾驶路线的边际成本及投入产出特征如何?

答:

1、纯视觉固定的系统性投入巨大(且由车企承担成本与风险,不像激光雷达可以顺利地转嫁给消费者),但新增客户的边际成本极低(软件OTA几乎零边际成本,不像其他雷达类传感器硬件,卖一台就要装一台硬件),规模优势及网略效应更加巨大,越多的数据驱动算法越快的完善优化,而新增边际成本却快速减少。

 特斯拉每年投入后台超级计算机、顶级AI团队、仿真、神经网络标注及训练的系统成本上百亿元,,但巨贵的激光雷达,数十个的毫米波超声波雷达的硬件成本却要客户在购车时代为承担了,且该成本每卖一辆车就会多一个客户承担。

2.建立数据引擎,依靠海量真实有效道路数据与仿真数据驱动规控算法无限优化提升,直至安全水平大幅高于人类平均水平。

       特斯拉目前就己训练出数万个实用的神经网络模型,用于应对复杂多变的路况,比如说针对无保护左转这种传统自动驾驶无法应对的场景,就不断训练迭代了蠕动网络,停止线网络,借用中间安全带停车的神经网络等许多模型,目前在无保护左转方面表现也己优于普通人类司机,大幅高于其他自动驾驶系统表现。

      目前FSD BETA测试阶段就己在真实道路上实打实地训练了1.5亿公里的里程,另外加仿真每天虚拟开车500公里,影子模式下跟车练习每年更是高达数百亿公里,这些数字还在随车队增加而快速增大(10年后车队规模上亿),哪个老司机的经验能丰富过这种系统呢?

3..纯视觉算法模型的可复用性,应用到其他领域的商业前景方面,比如智能人形机器人领域(详见视频:颠覆劳动力:盘点特斯拉机器人祖孙三代惊人表现瞬间及演化历程,直面与Fsd(取代司机)同用纯视觉神经网络的擎天柱(劳动力)进化迭代将带来的产业变革。

问题四:特斯拉打造的纯视觉闭环软硬件体系,具体有哪些组成部分?

答:特斯拉的纯视觉闭环体系主要组成:闭环自研的高算力FSD芯片、超级计算机DOJO、巨大的车队规模及海量的有效数据训练、仿真及自动标注技术、传感器及控制器软硬件趋向100%自研。

由于纯视觉系统工程的投入主要在算力、数据、算法迭代层面,每年固定投入成本高,但随着应用规模增大,边际成本趋近于零。

纯视觉的可复用性极大,由此构成一个更大的纯视觉闭环宇宙:除了特斯拉FSD,还包括:

特斯拉人形机器人(擎天柱)

智能机器人自行生产维修新的人形机器人


语义对话机器人

open ai主要创始人马斯克可能已经在招募团队开发对话类AI机器人


脑机接口


而视神经的处理占了人类大脑皮层的大半算力空间


火星探索


猎鹰重型火箭回收技术在星舰往返火星时十分重要


特斯拉Fsd纯视觉闭环软硬件体系缘由及展望的评论 (共 条)

分享到微博请遵守国家法律