一篇文章搞懂机器学习——文科生写给文科生的人工智能科普
这篇文章是科普的尝试,本人并不熟知人工智能,且咨询了一些专业领域的好友后也得知这一领域的学界对一些概念定义仍有模糊,如有错漏请各位批评指正。
本文的理解和例子很大程度上参考了以下视频:

近来,随着国内资本终于准备好迎接又一轮技术红利,Chat-gpt相关的热潮再次掀起。许多并不关心技术前沿的人文社会科学研究者也感受到了前所未有的危机感,原本就处在此领域的学者们则依旧焦虑。笔者在法学、哲学的若干课上几乎无数次地听起教师同学谈起相关话题,若仅是为了图一乐了解一下“人工智能是啥”,则本文并无意义。本文默认读者已经对人工智能、Chat-gpt、AlphaGo、自动驾驶、DeepL、AlphaFold、计算机算法、大数据、云计算、元宇宙、脑机接口等新潮玩意有所基本认识,且期待对人工智能进行一个更深刻的思考,即正追问:“人工智能到底是啥?”“它的原理又是什么?”
长久以来,笔者观察到无论是普通网民还是身边熟人——乃至一些学术界颇有能力、地位的学者——对人工智能的理解趋向于两个极端:要么将其视作极其浅薄的纯技术性产物,只能简单地按照特定流程应答预设而无关乎思想与心灵,认为其对人类社会的动摇充其量不过是又一次机器取代人类,只需要在技术哲学、社会学的角度上加以反思;要么将其视作神秘而强大的力量,那已然觉醒自我的他者与人类交往迫在眉睫,充满科幻小说式的憧憬与想象。可以说,这两种观点都是一些关于人工智能的信念,就立场而言则都有些独断。而任何讨论的基础一定是客观的共识性认识,否则充其量只是“畅想”。本文旨在表达人工智能并非不可认识之物(事实上,许多理工科的本科生就在字面意义上“手搓人工智能”),并尽可能用易懂的语言让各位基本理解其底层机理,区分于泛泛而谈的、玄乎其玄的、不知所云的博眼球式科普。由于本人并非科班出身,如有疏漏错误敬请指正。
首先是一些我的一家之言,作为引言:
1、任何声称“现有的人工智能已经产生人类意义上的自我意识(区分于可能有人主张万物有灵或泛我论)”的观点都是独断而不可靠的,目前的人工智能与该状态仍然有质的差距。因而,任何基于此设想的讨论,例如“人工智能叛变”“人工智能统治人类”等等都依旧是假想语境里的讨论,甚至不是可预见的近未来话题。
2、人工智能在基于神经网络的深度学习应用(借助大算力大存储硬件)后产生了质变,部分突破了图灵测试的中文屋悖论。这将是是一个关键节点,深度学习的人工智能与普通问答机器人的区别极大,不可同日而语,但依然远远称不上真正的智能。
3、此次人工智能革命将对社会产生深远的影响,影响力的下限与机床、互联网的同等,上限不止于蒸汽机的诞生。
4、当下的人工智能可以部分地模拟人类思维的功能——其机理上极可能一致——并且对强依赖于这些功能的职业和人群进行取代(不考虑经济成本和法律伦理问题时)。具体而言,若有一个职业是宣称“零基础培训X天可上岗”“X天速成”,或让你认为“我只要努力学,花上足够长的时间,早晚有一天是能顺利做成的,不存在任何阻碍”,那么便可以被全部或部分地取代。例如,纯粹面向商业用途不具有艺术价值的插画、翻译、驾驶等。反之,若是有一些领域人们普遍认为需要灵性、悟性,或是我们自觉并非任何人都能达到那样的水平,天才与庸人有着不可逾越的鸿沟,那么当前的通用人工智能无法取代人类。例如,数学理论研究,文学创作等。
*具体而言,笔者并不认为人工智能与人类的区别是理性和感性的区别。人工智能当下能归纳地处理综合命题、经验论领域的问题,但无法抽象演绎地处理分析性命题、理性主义领域的问题。注意,对语义的分析并不算此类,因为语法规则依旧是综合的,而高阶逻辑的反思是尚且无法作出的(但并非理论上不可能),具体在人类社会中就是“妙手偶得”“创见”一类东西。
5、人工智能在作为一个客体的意义上依旧是完全可控的,不涉及任何主体间性或其他智慧体与人类接触的问题。若将对技术利用的探讨上升到某种“关系”的探讨,则要么是在主奴辩证法这类观念论立场去谈,要么是基于当下状态对人类思维的一种揣度和推演。
需要强调的是,本文不探讨“人工智能与社会认可”的任何问题,例如某写诗机器人被出版了代表它被社会认可了、某机器人被授于了公民地位,均不能在本质上说明任何事情。要分享的仅仅是人工智能究竟是什么,其底层逻辑是什么。

许多人在思考人工智能相关问题的时候,往往会追问“智能是什么”。这是难以回答的,但作为人类而言,我们日常语境中说的“智能”往往指的是那种处理唯有人能做的事情时,需要通过人脑对信息进行处理的能力。
我们姑且不去深入这一问题,回过头来说人工智能是什么。
考虑到计算机领域甚至仍然存在“鲁棒性”这样的词汇,除了用来忽悠投资人和网上的普通受众以外,任何欲图对其加以了解的人都不应当只满足于字面意义的理解,而应追究其本质。换而言之,“人工智能”这一概念的提出或许期许着它形成真正意义上的智能,但它仍基本是以计算机程序作为形式结构的,其本质上是一个以计算机算法为核心,以解决问题为目的而诞生的小玩意。同样地,“神经网络”一词虽然是一个绝妙的象征和比喻,其在功能上是个妥当的类比,但其结构是否与生物意义上的神经一致似乎并不那么站的住脚,立足于字面意思进行揣度和理解只是南辕北辙。
那么,基于神经网络的人工智能能做什么事情呢?
总的来说,它做的事本质上是“分类”。即将一类数据与另一类数据分开,它就是要去求得那条分界线(面)究竟在哪里。这一分界一旦求得,也就可以对更多的数据作预判,因此也可以笼统地讲,它所做的是“判断”的工作。
让我们从经典的房价问题入手。为便于理解,可以设想这样一个情境:你是某地产公司的员工,负责管理公司旗下成百上千套房产的档案。房产档案非常简洁,内容仅仅有三项:“房产所属地(精确到市)”“房屋售价(总价)”“房屋总面积”。照理说,整理这些档案并不算个难题,但一次突如其来的火灾席卷了档案室,大多数档案完好无损,但也有一些出现了残损。现在,你的手头堆满了“房产所属地”残损的档案,老板安排你负责整理这一部分。值得庆幸的是,你很清楚失火的房间里只有北京和通辽两地的房产档案,因此只需要根据售价和面积将两边区分开来便是了。
聪明的你想到,北京的房价何其之高,这是个绝佳的线索。自然,你不会蠢到直接比较房屋售价,而是会先求得每一个房产的平均价,再将它们由高到低排序。但,房价高到什么程度会是北京的房子呢?这根本难不倒你,毕竟尚且有完好无损的档案,你找到了北京房价的最低价,又找到了通辽房价的最高价——这样一来,你大概可以判断在什么价格以上的房子几乎一定是北京的,什么价格以下的房子几乎一定是通辽的。自然,你很清楚,总会有那么一些例外,在价格居中的位置也难以判断,这就需要进一步检索数据库编码了。但毕竟你已经大大降低了求证的难度、缩小了需要进一步调查的范围,虽然难免有差池,也足以到老板那里邀功领赏了。
这样一个问题,似乎每一个足够理性的人都能作出如上所述的解答,而它背后蕴藏的路径却绝非那么简单的:想象一下,一个卫星里的外星人(或者没有任何常识的数学神童)目睹了这场火灾,想要自己也尝试着不依赖任何额外信息地解决这个问题,能否顺利解决呢?
他首先就会遇到一个问题:数字,认得,但是这俩数字背后的含义,是啥啊?
哦,忘了告诉大家,这个外星人的母星已经早就没有了“房子”这个概念(因为他们的肉身已经变成能量态),也没有了“价格”这个概念(因为是类似虫族的集群意识)。至于“北京的房价比通辽的房价高”这种“常识”,就更是不要期待他去知道了吧!
那么,这个“房地产的档案整理问题”在他的眼中就变成了单纯的“将若干组数据划分成两类”的找规律数学题。这里就不得不提到一个各位在初中就学过的数学概念“数形结合”。自然,我们可以引用这位外星人的祖先高文大帝的故事来作为一种隐喻(注意,这是一个有魔法的奇幻世界):
高文的帝国疆域刚好是一个规整的正方形。最近,他突然收到了一些汇报,声称帝国里陆续出现了大量一出生便觉醒超能力的“超凡者”。这本该是件好事,但因新生儿过于体弱,一旦觉醒超凡力量,反而会在几天内走向失控——除非派遣白骑士前往进行精神镇定。这是个大难题,毕竟全国的白骑士数量是有限的。
这时,大帝自信地掏出了一张神奇的魔法地图,其形状四四方方,正是对应着帝国领土的每一个角落。这个魔法地图可以呈现出每一个国民的位置,标记为一个绿色的点。由于超凡者体内蕴藏特定的魔法力量,在地图上会呈现为一个红色的点。经过观察,大帝发现红色的点普遍集中在地图的左上部分。或许是由于帝国的西北角有一座巨大的魔法矿脉“深蓝之井”,又或许是同步轨道卫星辐射范围带来的差异,他有一些推测,但已来不及调查,于是大手一挥画下了一条红绿分界线“/”,命令全体白骑士向着分界线西北方向集结。
随着越来越多案例的出现,这条分界线显得愈发清晰,大帝也屡次调整这条线的精确角度和位置,最终,相当长一段时间都未有反例出现。同时,他也派遣了一队钢铁游骑兵前往分界线处,调查这个分界线上到底发生了什么。他将地图交给实地执行工作的白骑士莱特,并告诉他:“如果一个代表新生儿的点出现在线的西北边,一定要执行监控,因为他很可能在几天内觉醒。”莱特如此行事,几乎没有出过差错。
我们发现这个神奇的地图可以达成某些效果:
1、把可能觉醒超凡者的地区和不可能觉醒超凡者的地区划分开来。
2、得出异常区与正常区的分界线。
3、在出现一个新生儿时,预测它是否可能成为觉醒者。
神奇的是,包括大帝在内,没有人知道那条线到底是什么,原理是什么,但它就应当被画在那,因为它很高效地将差别鲜明的两组东西分开了,仅此而已。
外星人受到了启发——“虽然我不知道这其中的规律是什么,但人类管理员既然成功了,在其背后就一定暗含着一个伟大的规律(可怜的外星人并不知道这个规律仅仅是‘北京的房子更贵’),并且这个规律可以从单纯的两个数字中推演出来。那么,就将‘房屋售价(总价)’‘房屋总面积’这两个异星符文下面的数字放到平面直角坐标系的XY轴上吧!”
他发现,人类管理员使用了完好的档案,也就是说“北京”和“通辽”这两个异星词汇代表了数据的两个种类。于是他也调取了尚且完好的房产档案,就好像高文大帝领土上一个又一个新生儿,将它们化作地图上的点放到虚拟空间的坐标系之中——若是北京,则标注红色,若是通辽,则标注绿色。画着画着,他发现了端倪,这红色的点和绿色的点俨然也隔着一条笔直的线,被划分成了两部分,正如许久前高文先祖遇到的情形一般!随着数据录入越来越多,红色的点和绿色的点都不断逼近分界线,这条线的画法也愈发地被限制住,直至大抵不会发生什么变动了。(这是一种理想化的可能,事实上究竟如何选择这条线也是一种策略,即激活函数,但此处不妨碍理解,故不过多赘述)
他谨慎地拿出一组完好的数据,根据横纵坐标判断,它处于线的左上方,因而是“北京”。紧接着,他小心翼翼地察看了这组数据的标志——果然是北京!一次,又一次,几乎都不会出现差错。外星人看着那条神圣的线,仿佛发现了一个来自异星的至理,用激动而颤抖的双手写下了这条线的方程。(这条线的方程的含义是“每平米房价为11451元人民币”)
有趣的是,如此一来,一个甚至不知道房子是什么的外星人,竟然通过单纯地观察两地房价的数字,得出了等效于人类管理员数十年经验(当然,没有用那么长时间在认识这件事上)的方程,这是一条纯粹由下而上的、经验主义的路径。
请注意,这里并不是“外星人看起来得出了和人类管理员一样的结论”。“人类管理员运用常识性经验后得出的结论”与“外星人通过数字归纳得出的结论”,在数学上是完全等价的,都是“每平米房价高于X时更可能是北京,低于X时更可能是通辽”,外星人的方程仅仅缺少一环应用于人类语境的阐释而已。
相信各位已经多少看出来了,这里的“外星人”实际上就是指那个程序,广义上讲,上面所述已经是一种机器学习了。但别急,好戏才刚刚开始,因为可怕的是,这种归纳的方法是通用的,只要算力足够。
回到高文大帝的故事。起初,一切都执行得很好,每一个觉醒为超凡者的新生儿都被准确地预测到,这极大地降低了对社会的危害,众人也已经将那魔法地图视作真理。突然有一天,地图上的反例出现的越来越多,原本以为不会出现觉醒者的东南方位涌现了许多红点,而原本就有觉醒者的西北方依旧有红点——似乎这时觉醒与否已然与那条分界线毫无关系!
大帝不愧是大帝,敏锐地派出精锐探查地下的刚铎遗迹。果不其然,所有的感染者——无论在分界线哪头,都无一例外地是出生在地下的!他们中有些是躲避严寒的北地居民,有些是原本就在地下的暗影族,有些则是地下遗迹和矿坑的工作人员……但他们有一个共性,便是都生活在地下。
这个事情告诉我们的生活小贴士也是显而易见的:有时候若理不清一件事(搭讪对象的反应)与它的变量X(搭讪的内容)和变量Y(搭讪的态度)的关系,那极有可能是因为存在着一个隐变量Z(今天有没有洗头),一旦找到了它,便一切豁然开朗了——这就是升维。
幸运的是,在数学的意义上,我们可以进行无限的升维。XYZ的三元方程远远不是极限,只要算力足够庞大,我们可以引入成百上千个变量。三维空间里,一个曲面会将数据分为两部分,多维空间里,也总会有一个超曲面将数据分为两部分。根据我们上文所说,只要引入的变量足够多,总会揪出所有的隐变量,在无穷无尽的尝试之后,总会有一个超曲面能近乎完美地将两种数据分开。
举个例子,一位好朋友想要向我安利歌单,但我只会告诉他“是的,我喜欢”“不,我不喜欢”,而不会告诉他任何具体的喜好。若是他按照年代推荐,则会发现我什么年代的曲子都喜欢,按照地区推荐,则会发现我什么地区的曲子都喜欢,这使得他一头雾水。如果他幸运的话,我或许喜欢的是纯音乐,于是当他引入“演奏乐器”这一维度时便可以相对精准地推荐歌曲了。当然,这永远不够精准。但如果我的好朋友有一颗RTX4090的脑子,我又能回复他我对数以亿计歌曲的喜好反馈,他会尝试询问我各种维度“地区”“乐器”“长度”“年代”“音乐类型”“情绪”“曲速”“是否是二次元”……最终拟合出来的超曲面,就是一个无限接近于我本人音乐品味的东西。你去问我喜不喜欢一首歌,和你去问我的好朋友“pw0会不会喜欢一首歌”,得到的答案几乎一定会是一样的。
这些维度在数学意义上具体而言有什么用处呢?让我们回到二维的例子。
想象一下高文大帝的正方形国土,其正中有一条“/”形状的分界线。在此线西北的地区已经被一种黑暗的邪恶力量侵蚀,人们在上面很快就会死亡。那么,你是一位旅行者,在东南地区会得到怎样的告诫呢?“绝对不要前往西北方向。”这是最起码的。
但有些诡异的是,有些人会说:“如果你不知道自己在哪,且只能往西北走,那么宁可往北走,不要往西走。”原来,即使是在安全地带,有时也会被迷雾蒙蔽双眼。这段话的道理是显而易见的,生死的分界线虽是斜的,但更接近垂直方向,在任何一个点,向着西边走都要比向着北边走死得更快。
现在带着这种隐喻回到房价问题里。当我们说“哦不,我看错了,房价其实要比刚刚填写的多十万(元)”时,似乎不大影响我们的判断,但若是说“哦不,我看错了,房子的面积其实要比刚刚填的多十万(平方米)”,好家伙,这事不就闹大了。(当然,一般而言会统一到差不多数量级的单位,但依旧存在着一个比例而不会是一比一)
这时候实际上是在说“房价变化X元”对于“这个房子是哪里的房子”这一结论影响的重要性不如“面积变化X平方米”对结论影响的重要性大,换而言之,所有变量都平等地影响着最终的结果,但有些变量比其他变量更重要一些。例如购买一辆车要考虑性能、经济性、空间、智能化等因素,它们共同决定了“值不值得买”这一结果,但当我们确定一个语境(也就是回答“值不值得买”的语境,例如“对于一个打工人值不值得买”)时,其中一些变量(例如“经济性”“空间”)就会比另外一些更加重要,这个“重要性”,便是所谓“权重”。
这时候一定就会有人问了,既然如此,权重如何得出呢?这里的权重,事实上就等价于房价问题中的那条线(因为那条线的方程包含了XY的系数),或者更复杂问题中的超曲面。具体操作起来,是巧妙地运用了数学变形后梯度下降地求超曲面极值,这里不去赘述。但我们清楚,这个过程之所以能够实现,是由于它获得了反馈,即知道了“当下的判断标准”与“人们的判断标准(或正确的判断标准)”有所差异,通过海量的尝试最终找到最接近“人们的判断标准(或正确的判断标准)”的那种方案,此时的方程便体现了权重。
可以试想这样一个实验,我们设计一个模仿人体结构的机器人,要其保持平衡地骑自行车。我们可以给它的每一块肌肉和骨骼标号,当自行车保持平衡了,就给予正反馈,自行车偏斜了,就给予负反馈,如此重复成千上万次。最后我们会得到一串长长的表格:“1号肌肉,向左移动,有用程度0.1%,2号肌肉,向上移动,有用程度0.3,3号肌肉,向下移动,有用程度28%……1号骨骼,向前移动,有用程度13%……”(此处仅仅是辅助理解,因为这将若干系统视作孤立的零件,实际上并非如此简单)当我们知道了“每一块肌肉在每一个瞬间向每一个方向移动”对于“保持自行车平衡”的有用程度,我们自然可以让机器人作出一个时刻都能让自行车不会倾倒的行动。
那么,我们人类学会骑车的过程,或许也是如此?
现在我们回头看看,基于神经网络的深度学习如何区别于传统的算法。传统的算法中有“时间换空间,空间换时间”一说,这里的空间指的是空间复杂度,即占用系统临时存储空间(内存)的程度;时间指的是时间复杂度,即输出答案的时间虽输入数据数量级变化的速度。这二者可以互换,通俗地说,优化一样的情况下,占内存小的程序跑得慢,占内存大的程序跑得快(这不废话?)。但机器学习打开了一条新的道路,通过预先的海量训练得到可靠的算法,在实际应用时消耗较少的资源,类似于一种“算力电池”,实现了时空复杂度的调配。
熟悉计算机的朋友或许知道一种被称作遗传算法的东西,就是通过外部的反馈不断迭代,使结果越来越趋近于真实值。(可以想象一下“指挥另一个人挂一幅画”或者“指挥倒车”时不断微调的过程)在原理上,机器学习非常相似,但这里不断趋近于真实值的并不是某一个问题的结果,而是“处理这个问题时各因素的权重占比”,即“解决这个问题的方法”。也就是说,遗传算法迭代的是结果,而机器学习迭代的是解决问题的方法自身,它可以实现真正意义上的成长——至少在骑自行车的意义上,我看不出深度学习与人类学习在原理上有何本质不同——试错,得到外界反馈,调整用力的部位和方法,再试一次,直到成功。
传统的“图灵测试”受到一种“中文屋诘难”。图灵测试的大意是,我们虽然不能判断一个机器人是否真正意义上有了自己的思考,但若是他表现出来的样子能骗过绝大多数人,则足以称这个机器人有了自己的思维能力——毕竟无论它实际上有没有,对于我们而言都是相差无几的。“中文屋诘难”则是强调,即使装得再想,也终究是装,存在着一个无法逾越的鸿沟:就好比一个在线聊天室里有一个不懂中文但有着近乎完美的翻译设备的人,通过对话,他可以让大多数人以为他是个中国人,但他到底不是个中国人。
一些低端的问答机器人就是这样的结构:预先设定好一些口令,例如“当用户询问‘当前的时间是多少’(具体而言,包含‘时间’这一关键词)时,回复当前的系统时间”,并将这一口令集不断扩充和优化。一旦出现口令集以外的询问,则会回答“对不起,我听不懂你的意思。”这也是我们大多数人对“弱人工智能”的认识——许多人说,人工智能说到底只是固定的程序,你问什么就答什么,程序员早就设计好的——在这一意义上是问题的。
但机器学习的玩法改变了一些事情。
首先,就原理上,我们惊讶地发现,我们自己在“学习”某些简单的技能(例如骑自行车)时,或许和我们命令机器做的事如出一辙。对人工智能的探索,反而回过头来促进了对人自身思维能力的反思。其次,当数据量和运算量爆炸到一个质变的节点后,我们已经无法说这时的人工智能是“程序员设计好的”了,因为就连程序员自己也无法预测程序的结果。每一次程序的自我迭代是根据“投喂”的海量数据(也就是上文所提及的反馈)进行的,这已经远远超越了程序员把握的能力。而且,事实上程序自己迭代的次数也是天文数字级别的,在一个深度学习的人工智能训练中,“亿”是最基本的单位,每秒钟能运算亿亿次的机器连续不停地运转数月,将会得到怎样的产物?这就是为什么所谓“隐藏层”是隐藏的。
以“图像识别”为例。人类的介入主要在三个环节:程序的编写,数据的输入(即反馈),模型和激活函数的选择。
若我们要识别一个图像的内容是什么,我们第一步要怎样做?很简单,将一整张图片解构成无数像素点,记录每一个像素点的颜色、亮度、相对位置,并变成一张数字的表格(矩阵)。是的,人类程序员所做的事情只是尽可能把“需要被认知的素材”处理成“程序能接受的形式”,也就是捏了一个程序的“感觉器官”而已。
至于后续输入的数据,绝大多数都是从互联网上爬取下来的。通过网络上的海量数据,程序可以知道“哪些特征的权重对于‘这张图是狗’的重要性比较大”“哪些特征的权重对于‘这张图在pixiv上获得更多赞’的重要性比较大”,并不断调整自己的能力。至于这其中的内容,极有可能连程序员自己都理解不了,行得通就是行得通,行不通换一个方式就是了,以至于有人戏称其是“炼丹”的过程。(自然,人类依旧做了重要的事情,就是“模型与激活函数的选择”,这个稍后再论)
试想,有一个小孩从小被送到画室学习绘画。他的能力是每秒可以画出一亿张画作,代价是每一张画都是随机的。所幸,有一位老师,这位老师记得从古至今的所有名画的模样,并能比对着在一瞬间批评这位小孩,“你的作品与某名画在某些地方存在着某些偏差”。小孩脑海里着数以亿计的“旋钮”,每一个“旋钮”都决定着他的绘画的某一方面的某种倾向(例如“更加明亮”“过渡更加柔和”“相邻的四个像素色相更接近”“‘面部’中央位置的像素点偏洋红”……),他每被批评一次都会努力调整,直到这样的状态:以自己的能力,每画一次画,被老师批评的次数尽可能低——经过若干年后,这位学徒的绘画技术会达到怎样的高度?
有的人或许会说,到不了怎样的高度,因为这样得出来的画作是没有灵魂的,是没有深刻思想的,只是对无数优秀作品的摹仿。但试问,在美术培训,尤其是“X天速成日式插画培训”的体系下,难道要比如是的情况好上许多?
因此,相比于单纯的按照程序指令行动、将既有的东西拆解打散后排列组合,当下的人工智能在处理某些事情时将更接近人类事实上的行动,已经在某种意义上突破了“中文屋诘难”——这家伙学起中文来,简直和我自己学外语一模一样——除了快了几亿倍。
笔者记得自己在孩童时期闹过一次笑话。当时的长辈教导我什么样的车叫做公交车,什么样的车叫做出租车,我便常常问“这个是不是出租车?”“这个是不是公交车?”在长期总结观察后,我得出了结论:矮矮的、圆滑的车就是出租车,大大的、方形的车就是公交车,世界上只有这两种车。于是,我便拉着家人非要打一辆黑色高级轿车。家人无奈道:“这不是出租车。”经过更多地观察,我发现“矮矮的、圆滑的、有特殊涂装的车”才是出租车。这样一个经验的、归纳性质的认知过程,与人工智能的“图像识别”有何差异呢?而事实上,“出租车是由出租公司运营的、可以供人临时雇佣的汽车”这样的定义也是在极晚的时候才了解到的了。
相比于人脑,机器学习可以将互联网上的海量数据作为认知素材,又能将心中那个模糊的标尺量化地呈现出来。例如,我们若是询问“X大学是不是一个好大学”,每个人会有每个人的答案,但他们心中都有一个模糊的界定是否是好大学的标尺。故而每一群人也都会有每一群人的答案,他们的标尺平均而言也是存在的,却无法被任何人精确地指出来——但人工智能可以。
机器学习并不一定是最高效的方法,但它却会是最接近人的一部分思维的方法。可以考虑这样一个最简单的案例“判断数字是否是正数”。任何一个编程的初学者都知道,只要将这个数字与0进行比较就可以输出答案。但若是硬要用机器学习的思路来做,大约会是这样的:程序一遍又一遍地询问“这个数是不是正数?”,我们一遍又一遍地告诉它“是”或“不是”,最终它将会大概觉得,正数和负数的分界点在“-0.094”和“0.021”之间的某一个位置,极有可能是“-0.011”。
这看起来有些愚蠢?让我想起一个故事:一节数学课上老师在介绍平行线的概念,说:“你们看,这里有两条线,把它们延长,无论再长也不会相交。”一个学生问:“不管怎么延伸都不会吗?再长一点呢?如果画到黑板外面呢?”
这似乎告诉我们,当下的人工智能所作所为与一些孩童的思维、一些人的部分思维已然如出一辙,至少也是“师出同门”,这决定了当今的人工智能已然超越了以往对“计算机程序”的认知,不断模糊与真正意义上“智能”的界限,甚至足以取代一部分脑力劳动者的位置。但在人类的思维这里,仍然有一些额外的东西,这部分能否被人工智能模拟出来,是大多数科幻式畅想的前提,让我们拭目以待。

