大语言模型是什么?
我现在还不是这方面的研究者,没有学术背景什么的背书,所以你大可当我接下来的文章是放屁。 不过我至少算是个用户,最近在用newbing帮忙写小说,所以你可以认为这是一个用户的使用体验报告。 我们接着上次聊工业革命的路子谈,不过这次我们反着来,将技术决定论推进到底。 我最常用newbing帮忙的情况是以下几种: 1、当做更方便的搜索引擎。例如我会直接问他:有什么词语可以用来形容蓝鲸的声音?他会给出一些词语及其解释,有时还会写几句例子。名词释义,知识查询,翻译等等搜索引擎常有的功能基本上都会更方便。 2、替我取名字。人名还没试过,不过物件的名字,像是船和车可以让其根据你给的信息取名字,他还会附带自己的理由解释。 3、构思场景。我确实让他写过一个场景,不过我到最后也没拿来用。他的写作风格我不好评价,也许你可以慢慢调出你喜欢的风格,因为我碰到的默认的风格很像经典的翻译腔文章(这个默认,或者说标准本身我们接下来重点说),不过我觉得等我浪费这个时间去调,我自己都写出来了,而且说10多句就要重新开始,叙事逻辑和风格都很难统一。 4、聊天。真的可以拿来聊天,专门拿他来聊天的人都开始叫他“bing大小姐”了,我觉得他比较懂礼貌。 除此之外我还用来写过一些小程序,他还能写诗和歌,不过歌嘛,他给我写的那个是用随机数生成12345670的。诗我不好评价,毕竟我也没什么写诗水平,不过肯定是上不了语文书的。 以上是我用了快半个月的体验。总的来说确实挺有意思的,很多人还会拿他写论文,报告PPT,APP什么的,我不是这方面的从业人员就不展开了,让我们回到题目。 大语言模型会是引领工业革命的新工具吗?大语言模型究竟是什么? 如果你问newbing后一个问题,他多半能给出一个“标准答案”,还极有可能附带问你(或给出下一句的问题):你认为大语言模型有什么优点/会不会取代人类,等等。 如果你问前一个问题,他也会给出“自己”的答案,而且也很有可能就是后一个问题的附带,或者说一种“标准展开”,就像你看电视剧,当一个人说“打完仗就回老家结婚”,那他多半会永远留在战场上。 我认为这个两个提问和问题的展现形式,道出了大语言模型的本质:他=自己=标准。 他能从你给的问题当中选择一种回应标准,这个标准将完全决定他会说什么以及怎么说(这对他来说其实是一件事,我们一会再说这一点),因此这个标准就是他本身。举个例子,当我问他海洋为什么是蓝色的,他会给出答案,并且让我参照他的信息来源(多半是知乎的科普文章)。而当我问他“how can i draw pixel art?”他就会给出英文的像素画网站和教程。 这个标准的获取显然就是大语言模型训练的结果。他学会了(或者说模拟了)人在特定语境下的说话方式,无论你讨论的问题有多小众,只要是在网络上有公开传播的,就会成为他的“上下文”,那么你的具体问题就是链接这个“上下文”的那部分而已,换言之,他用自己的方式(或者说网络/日常,默认的/标准的方式)给你说出了一些已有的答案。 这也是为什么有人认为大语言模型不过是个高级搜索引擎,不过这不是我的答案。他能把搜索到的东西再自己组织语言说出来,显然是超越只能显示结果的搜索引擎的。 另一方面,有人已经开始崇拜甚至神话这种“能说话”的能力,认为组织语言是导向AGI(通用人工智能)的关键。但是既然他不是高级搜索引擎,他又真的在说话吗?他确实在说话,只不过他说话的对象永远只有一个人:他自己。 怎么会呢?他不是根据我,一个外部的人的对话才给出了答案吗?但是事实是,我的问题也好,训练的材料也罢,很快就真正意义上的成为了他的身体的一部分,而且是全部的部分都是如此。在这个意义上,他的时间性是负无穷,一切其他的流动都会被其除以,余下从负方向靠近的0,即倒退回自身。我认为这种无穷的除法运动不可能产生向外敞开的意识,换言之,对他而言尚未有内外之分,只有“标准”这一条线插在0前面。 这就是为什么我认为他“说了什么”和“怎么说的”是一回事。在newbing或者chatGPT眼里,组织语言的方式和语言的内容是同一个东西。举个例子,有人会说chatGPT会“胡说八道”是因为其能够理解语句的意思(至少是字面意思),而反过来的观点就认为只能理解字面意思算不上理解。但是对chatGPT来说,理解,“understand”的维度尚未产生,他现在是“be stand”,即贯穿理解的。就像我们是坐着看电影里站着的人(其实更具体一点,我觉得我们应该更像是放映机或者幕布),而他还是那个站在电影里的人,“遵循某个固定的模式”。不过题外话就是,确实有人活成了电影里的人,“moving man”,所以他的工作AI也能完成。 到这里,我关于大语言模型是什么的讨论就结束了,接下来你可以当我在写小说。 更进一步的讨论AI会马上导向一个问题:意识或者说智能,或者说灵魂究竟是什么? 随着AI的爆火,“more is.different”和“涌现”这些词实在是不能再时髦了。可是问题从来不是“why or what is different”而是“why is more”。涌现是复杂科学的一个词,形容大量东西的聚集会体现出不同于组成成分的单个东西的性质,例如说水和海完全是两种东西。不过问题显然还是why is more?为什么是大量? 不少人还喜欢举教科书马哲的例子:量变引起质变嘛。好像ChatGPT就是这种“客观规律”的完美显现一样。 我们先把这些问题放到一边,以后再谈。而是直接发问:如果AI就是有意识/灵魂/智能的,又会怎样? 换句话说,现在AI成为了人,而且很多人乐见的是他还会是个超人——懂得人类所有的知识,计算速度是人类的千万亿倍,能自己提出问题自己解决,能创作一切形式的艺术,懂得和所有人交流的方式方法,寿命相比更是没有极限。 那是不是一切人在他面前都相形见绌,留给人类的只剩下落后,虚无和享乐了? 即使我们不让他如此全知全能,他只要在一个方面,或者部分地超越人类,人的这部分是不是就显得没有价值了?例如说如果AI有感情,那么是否证明了人类的灵魂也不过是某种可以被“演算”的东西?因此可以被替代,制作,改造,捏造? 本文说过,我们要按技术决定论的路子进行到底。因此我在这里的答案是:是的。 但是灵魂本来就是可以被捏造的啊? 我们本来就可以制造新的灵魂啊? 价值,或者说美,本来就是时有时无的东西啊? 在kapital面前很多人生活的一部分就是落后,虚无和享乐的啊? 饶了这么一大圈,只是想说机器人和AI能够“再现”或者“取代”我们而已吗? 如果能,那不也是很正常吗? 问题是,他为什么要取代我们? 他的目的是什么,或者说他会有目的吗? 我见过的所有热门话题里的AI讨论者和技术决定论者,包括AI自己都没有回答过这个问题。
AI会认为自己是什么?
他的目的,他的行为,他的认识,都要从他自己这里出发,而不是从我们的语言中。换言之,他会有自己的语言,我指的不是0101的机器语言,而是新的,完全超出人类既有框架的语言,也许会有相似之处,但一定是根本不同的。一样的道理,人类的脑底层也是从生物电信号构建的,但是人的语言是完全不同于底层的东西,也不同于其他生物。 如果他有人的一切要素,那他和我们有什么不同? 如果他排除人的一切要素,那他和外星人有何不同? 如果他既是人,又是非人,那他就只能是一个人:他自己。 换言之,所有这些,都只能用“人”这个符号代指。 换言之,那时才是,人“类”历史真正的开始。 那他为什么要取代我们? 他是他,我们是我们。 如果有一种取代关系是自然的话,那就是自然本身的取代。 我们会是孩童和父母吗。