ChatGPT来了慌什么

从alphaGo、到alphaStar、到各种智能音箱和客服机器人、再到今天的chatGPT,基于神经网络的独立产品不断在图灵测试的天梯榜中打出更高的分数。每次爆款产品的出现都会让媒体界一阵高潮,可如果细看这些稿件,就发现媒体对智能替代人类的措辞基本是一样的,总不就是人工智能将替代人类岗位的陈辞滥调。
人工智能替代人类确实不是捕风捉影,但是这个程度到底有多高、最终能有多高可能不像所渲染的那么科幻。
祛魅人工智能
台湾的李宏毅老师说把神经网络当作科幻电影中那种自主意识的机器人是一种麻瓜理解。神经网络说白了是一堆算式组成的函数,只是其中参数过多,目前没人说得清楚它每个步骤在算什么。
既然网络是一个函数,那么它能做什么其实是可以预见的。这个函数输入是数字,输出是数字,所以能使用数字表示的信息就有可能通过网络构建映射。尽管这看起来很局限,可是生活中其实许多事物都可以被数字表示:图像、音频、文字、机械的指令等等。但是那也只是映射而以,没有新的“反馈”输入,它是不会“自我进步”的。
正如LeCun大神说的,实现chatGPT的不是什么神秘的新技术,是学术界一步步改进训练技术逐渐变为可能的成果,一直跟踪学界的人应该不会对这样的效果感到太意外,而学界以外的人总是隔断时间才突然看到一个爆款。
不可小视的chatGPT
既然这些技术都是现成的,那是不是大公司都能搞呢?是也不是,理论上说确实大公司都应该能做出类似的东西,但是达到同等级的效果不是那么容易,其中有技术原因也有数据原因。在我看来chatGPT背后有两大功臣:其一是将超大规模数据上训练超大模型变为现实的技术人员,其二是互联网上认真发布稿件的平台和用户。
如果训练普通模型的难度相当于家搭设私有云,那训练chatGPT相当于做个阿里云。最后只有能将效果做到与顶级同一级别的能活下来,因为谁都不愿意浪费自己的时间在错误率高的平台上。因此即使很多公司能做出来,但最终占有率应该是天壤之别的,就好像现在国内的百度和其他一众搜索门户。更何况计算芯片和训练资料的搜集存储也是个不低的成本。
核弹原理可能很多国家都知道,但是在联合国禁核前成功造出核弹的却不多,并且第一颗核弹的意义是非凡的。chatGPT在文字机器人领域应该可以算那第一颗核弹,它给了人类一个可能性,一个超大规模网络的可能性,一个超兼容系统的可能性。大家应该知道它能回答各种百科,写代码,写文章,能基于对话作出即时反馈,这是超大网络才具备的兼容性。一些智能音箱看似有类似的功能,但它们其实能解析的指令是有限的,更像是用语音触发对应问题的按钮,而GPT这种超大模型才可以更加浩如烟海的语义中形成答案。
但是过多分析chatGPT的“人格”真的是麻瓜摸象了。真要说chatGPT是什么人格,那就是训练数据形成的平均人格。它这么回答不是它这么想,是训练资料里平均这么回答。

被击穿的数字技能屏障
人类文明如今很多的数据不再以实体保存,取而代之的是数字存储介质。要操作这些数据从来就是有门槛的,只是很多工具的存在,并且我们早已习惯了基本工具的使用才让我们感觉很简单。
试想如果在一座无人孤岛上给我们一个存了张图片的U盘,我们怎么才能读取。要看到这张图片,我们需要一台可以读取U盘的计算机,计算机中包含了交互硬件的软件和操作系统两层软件,操作系统中需要一个能解析这个图像格式的图像读取软件,和一个与显示器交互的驱动软件。然后呢?还需要我们知道怎么在这个计算机中把图片打开。如今我们觉得谁都会的打字在几十年前是个可以作为职业的技能。
是明明还有好多职业依赖这些门槛:很多企业文职使用office的技能比什么计算机大佬高多了,不会操作PS的摄影师应该是濒危物种了,学机械、计算机、建筑、绘画等等都需要学会使用专门的软件。使用这些专业软件是有知识门槛的,但这些知识不是天然的,是人造的,这种知识门槛暂且称为“数字技能”。
这些非自然的技能是无法被悟出来的,必须依靠记忆、学习和熟练。既然这些技能是靠重复能熟练的,那网络则可以替代人去建立这种映射。这是人工智能能够取代很多职业的根本原因。

替代还是改变
基于上面的理解,看起来操作软件的工种都有被替代的可能。可是摄影师和PS操作员能画等号吗?有些可能是,但不会都是。
我能想到的以后的摄影流程大概是这样:摄影师先拍一张主体,网络识别到后给出多种建议的拍摄角度,摄影师再基于经验和建议去更多的位置取景。然后作者将自己的风格或者样张输入网络,网络根据输入风格对所有样张进行修图并可选输出多种风格。于是可以一次性、短时间获得所有样张的输出效果,选出好的再进行微调即可。当然这里的微调可能也不需要通过现在我们所认识的菜单栏。整个工作流被改变,但人似乎仍然不可或缺。
拿很多其他的职业打比方也是一样,最终都会发现总有一点主观的决定需要人来作出,而这些主观的部分难道不正是这些职业中的乐趣所在吗?摄影师真的享受拿着画笔在PS上涂来涂去吗,客服接线员真的愿意从早到晚回答类似的问题吗,司机真的是在限速公路上从A到B体验驾驶的乐趣吗?所以这些机械性的部分被替代,机器还能给出建议辅助主观的决策有什么不好。如果一个职业就是找不到任何需要主观的部分,那这种职业和《摩登时代》有什么区别,消失有何可惜。
当然这个时候就引出另一个层面的问题,就是人工智能的加入将使得工作流简化,门槛降低,产出增加。那么势必同一工种将不再需要那么多从业者,可是世界就是那么吊诡地平衡,谁能想到工厂、农业自动化腾出来的劳动力造就了低价物流和客运。一本正经地分析具体哪些职业会消失,哪些会继续存在好比在30年前分析以后打字员是用五笔多还是拼音多一样,可能在将来很多前提都不具备了。
以前很多小牌商品需要地推上门推销,如今也并没有什么机器可以做这项工作,但是这个职业还是肉眼可见地销声匿迹了。所以究竟是人工智能顶替了人类,还是改变了需要人的工作。
五年太长,十年太短
抛开剂量谈毒性是刷流氓,抛开期限谈预测也是类似的问题。上一段说的那些抛开了各种客观因素,仅仅从原理上分析。这些新的智能产品是需要时间的,它们最终出现的时间和顺序都会极大影响未来世界的面貌。
五年太长,十年太短。这句话两种理解,一种是一件事如果能预测准,那么不用五年就可以实现,而如果一件事需要更长时间才能兑现,那可能十年也不够。另一种理解是新事物走进生活,有时迟迟不达预期,感觉五年的变化都显得太过于漫长和缓慢,比如ipv6、esim、苹果的屏下指纹;有时却过渡得让人基本感觉不到,但十年过去回头又发现沧海桑田似乎发生的太快,比如网购、智能手机、白发的父母。
既然未来是混沌的,对单一变量的分析意义有限,那么也可以说所有人其实都置身于同一风险中。即使需要害怕,所有人都应该害怕。谁能想到蟑螂是这么古老的生物。也许等人类掌握了更好的研究混沌系统的方法后,才能给出不这么模棱两可的答案。
真正应惧怕之物
神经网络的训练归根结底依赖反馈,这种反馈或者基于规则,或者基于数据。一些人工智能能将功能做好很大程度上得益于数据的充足,中英对照的资料、画师的作品、论坛里带评分的问答等等。而在一些缺少数据的领域,比如自动驾驶还得雇人生产数据,仅算国内,数据标注都是一门以千万计的大蛋糕。再比如医疗诊断,可以说这个基本没有技术上的困难,但产品稀少,因为它的数据不开源也不充足。
很多领域想作出能用的智能产品就如同望山走倒马,大可不必过于乐观。与其担心十年太短,不如担心五年太长。
至于哪些事情“五年太长”不能太展开,简单说就是那些非市场因素的风险。chatGPT对国内生活的影响,且不说其继承者效果如何,但可以肯定最后不是技术说了算。
附言:本来这篇稿子早就写好了,结果因为星际2夺冠的消息太兴奋发了另一篇,现在补上。