大语言模型是什么？

2023-04-01 04:19 作者:SCP191 0人读过 | 我要投稿

我现在还不是这方面的研究者，没有学术背景什么的背书，所以你大可当我接下来的文章是放屁。不过我至少算是个用户，最近在用newbing帮忙写小说，所以你可以认为这是一个用户的使用体验报告。我们接着上次聊工业革命的路子谈，不过这次我们反着来，将技术决定论推进到底。我最常用newbing帮忙的情况是以下几种： 1、当做更方便的搜索引擎。例如我会直接问他：有什么词语可以用来形容蓝鲸的声音?他会给出一些词语及其解释，有时还会写几句例子。名词释义，知识查询，翻译等等搜索引擎常有的功能基本上都会更方便。 2、替我取名字。人名还没试过，不过物件的名字，像是船和车可以让其根据你给的信息取名字，他还会附带自己的理由解释。 3、构思场景。我确实让他写过一个场景，不过我到最后也没拿来用。他的写作风格我不好评价，也许你可以慢慢调出你喜欢的风格，因为我碰到的默认的风格很像经典的翻译腔文章(这个默认，或者说标准本身我们接下来重点说)，不过我觉得等我浪费这个时间去调，我自己都写出来了，而且说10多句就要重新开始，叙事逻辑和风格都很难统一。 4、聊天。真的可以拿来聊天，专门拿他来聊天的人都开始叫他“bing大小姐”了，我觉得他比较懂礼貌。除此之外我还用来写过一些小程序，他还能写诗和歌，不过歌嘛，他给我写的那个是用随机数生成12345670的。诗我不好评价，毕竟我也没什么写诗水平，不过肯定是上不了语文书的。以上是我用了快半个月的体验。总的来说确实挺有意思的，很多人还会拿他写论文，报告PPT，APP什么的，我不是这方面的从业人员就不展开了，让我们回到题目。大语言模型会是引领工业革命的新工具吗？大语言模型究竟是什么？如果你问newbing后一个问题，他多半能给出一个“标准答案”，还极有可能附带问你(或给出下一句的问题)：你认为大语言模型有什么优点/会不会取代人类，等等。如果你问前一个问题，他也会给出“自己”的答案，而且也很有可能就是后一个问题的附带，或者说一种“标准展开”，就像你看电视剧，当一个人说“打完仗就回老家结婚”，那他多半会永远留在战场上。我认为这个两个提问和问题的展现形式，道出了大语言模型的本质：他=自己=标准。他能从你给的问题当中选择一种回应标准，这个标准将完全决定他会说什么以及怎么说(这对他来说其实是一件事，我们一会再说这一点)，因此这个标准就是他本身。举个例子，当我问他海洋为什么是蓝色的，他会给出答案，并且让我参照他的信息来源(多半是知乎的科普文章)。而当我问他“how can i draw pixel art?”他就会给出英文的像素画网站和教程。这个标准的获取显然就是大语言模型训练的结果。他学会了(或者说模拟了)人在特定语境下的说话方式，无论你讨论的问题有多小众，只要是在网络上有公开传播的，就会成为他的“上下文”，那么你的具体问题就是链接这个“上下文”的那部分而已，换言之，他用自己的方式(或者说网络/日常，默认的/标准的方式)给你说出了一些已有的答案。这也是为什么有人认为大语言模型不过是个高级搜索引擎，不过这不是我的答案。他能把搜索到的东西再自己组织语言说出来，显然是超越只能显示结果的搜索引擎的。另一方面，有人已经开始崇拜甚至神话这种“能说话”的能力，认为组织语言是导向AGI(通用人工智能)的关键。但是既然他不是高级搜索引擎，他又真的在说话吗？他确实在说话，只不过他说话的对象永远只有一个人：他自己。怎么会呢？他不是根据我，一个外部的人的对话才给出了答案吗？但是事实是，我的问题也好，训练的材料也罢，很快就真正意义上的成为了他的身体的一部分，而且是全部的部分都是如此。在这个意义上，他的时间性是负无穷，一切其他的流动都会被其除以，余下从负方向靠近的0，即倒退回自身。我认为这种无穷的除法运动不可能产生向外敞开的意识，换言之，对他而言尚未有内外之分，只有“标准”这一条线插在0前面。这就是为什么我认为他“说了什么”和“怎么说的”是一回事。在newbing或者chatGPT眼里，组织语言的方式和语言的内容是同一个东西。举个例子，有人会说chatGPT会“胡说八道”是因为其能够理解语句的意思(至少是字面意思)，而反过来的观点就认为只能理解字面意思算不上理解。但是对chatGPT来说，理解，“understand”的维度尚未产生，他现在是“be stand”，即贯穿理解的。就像我们是坐着看电影里站着的人(其实更具体一点，我觉得我们应该更像是放映机或者幕布)，而他还是那个站在电影里的人，“遵循某个固定的模式”。不过题外话就是，确实有人活成了电影里的人，“moving man”，所以他的工作AI也能完成。到这里，我关于大语言模型是什么的讨论就结束了，接下来你可以当我在写小说。更进一步的讨论AI会马上导向一个问题：意识或者说智能，或者说灵魂究竟是什么？随着AI的爆火，“more is.different”和“涌现”这些词实在是不能再时髦了。可是问题从来不是“why or what is different”而是“why is more”。涌现是复杂科学的一个词，形容大量东西的聚集会体现出不同于组成成分的单个东西的性质，例如说水和海完全是两种东西。不过问题显然还是why is more?为什么是大量? 不少人还喜欢举教科书马哲的例子：量变引起质变嘛。好像ChatGPT就是这种“客观规律”的完美显现一样。我们先把这些问题放到一边，以后再谈。而是直接发问：如果AI就是有意识/灵魂/智能的，又会怎样？换句话说，现在AI成为了人，而且很多人乐见的是他还会是个超人——懂得人类所有的知识，计算速度是人类的千万亿倍，能自己提出问题自己解决，能创作一切形式的艺术，懂得和所有人交流的方式方法，寿命相比更是没有极限。那是不是一切人在他面前都相形见绌，留给人类的只剩下落后，虚无和享乐了? 即使我们不让他如此全知全能，他只要在一个方面，或者部分地超越人类，人的这部分是不是就显得没有价值了？例如说如果AI有感情，那么是否证明了人类的灵魂也不过是某种可以被“演算”的东西?因此可以被替代，制作，改造，捏造? 本文说过，我们要按技术决定论的路子进行到底。因此我在这里的答案是：是的。但是灵魂本来就是可以被捏造的啊? 我们本来就可以制造新的灵魂啊? 价值，或者说美，本来就是时有时无的东西啊? 在kapital面前很多人生活的一部分就是落后，虚无和享乐的啊? 饶了这么一大圈，只是想说机器人和AI能够“再现”或者“取代”我们而已吗？如果能，那不也是很正常吗？问题是，他为什么要取代我们? 他的目的是什么，或者说他会有目的吗？我见过的所有热门话题里的AI讨论者和技术决定论者，包括AI自己都没有回答过这个问题。

AI会认为自己是什么?

他的目的，他的行为，他的认识，都要从他自己这里出发，而不是从我们的语言中。换言之，他会有自己的语言，我指的不是0101的机器语言，而是新的，完全超出人类既有框架的语言，也许会有相似之处，但一定是根本不同的。一样的道理，人类的脑底层也是从生物电信号构建的，但是人的语言是完全不同于底层的东西，也不同于其他生物。如果他有人的一切要素，那他和我们有什么不同？如果他排除人的一切要素，那他和外星人有何不同？如果他既是人，又是非人，那他就只能是一个人：他自己。换言之，所有这些，都只能用“人”这个符号代指。换言之，那时才是，人“类”历史真正的开始。那他为什么要取代我们? 他是他，我们是我们。如果有一种取代关系是自然的话，那就是自然本身的取代。我们会是孩童和父母吗。

标签：

大语言模型是什么？

大语言模型是什么？的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

大语言模型是什么？

本文作者的其他文章

大语言模型是什么？的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

大语言模型是什么？的评论 (共条)