聊聊我眼中的ChatGPT

聊聊我眼中的ChatGPT
今天,之所以想围绕ChatGPT写点东西,是因为新学期开课在即,仍然有人工智能这门课,另外三门是生物信息、强化学习和网络编程(智能网联),四门课都跟人工智能有关。开学第一课,必须得加上ChatGPT这个新内容,准确点儿说是新话题,做为课堂的热点导入。即便你不主动聊,学生也会问你的。甚至可以预测一下学生会问什么问题:
(1)老师你玩过ChatGPT吗?
(2)老师怎么注册ChatGPT?
(3)ChatGPT到了什么水平?
(4)搞定ChatGPT需要做哪些技术储备?
(5)中国版的ChatGPT何时问世?
……
前面三个问题是学生几乎百分百会问到的,后两个问题是学生可能会问到的。甚至你想不到的更多问题。
第(1)、(2)两个问题我一起回答吧。我目前没玩过ChatGPT,ChatGPT需要电话注册,暂不支持中国的电话用户。网上有一些注册教程,大致是花点钱买虚拟账号,步骤有些麻烦,体验不好,没有做下去。
第(3)个问题涉及到科技进展与本质,可以重点聊聊。第(4)个问题涉及到学生当下学习规划,也可以给点儿建议。第(5)问题,属于未来预测与期待了。
在此声明,写这篇心得时,虽然没有与ChatGPT面对面交流过,所有的经验仅限于阅读了一些别人的测试结果和科技点评,即便如此,也不耽误我自信地对ChatGPT指手画脚一番,暂且算作是盲目自信吧,毕竟在人工智能领域,我也是一个小小学生。
ChatGPT是由OpenAI研发的聊天机器人,2022年11月30日发布。ChatGPT出道即巅峰,媒体圈为之疯狂,科技圈为之疯狂,ChatGPT概念股票疯涨,全球IT江湖为之疯狂,甚至影响到了国家和区域的科技政策导向……
那么当下的ChatGPT到底是个什么水平?真的更接近了人类的“聪明模式”吗?真正更接近了人类的“智慧模式”吗?真正是语言领域和知识领域的“颠覆性技术革命”吗?
先说结论。我认为,ChatGPT的本质仍是一个人工智能领域的语言模型,追根溯源的话,源自CPT3、GPT3.5、GPT4这些语言模型的进展,再进一步,GPT又源自Transformer,所以ChatGPT的“智力”基因,根源在Transformer上。ChatGPT的“聪明本质”或者说是“聪明模式”,没有突破或者说颠覆Transformer的语言基因。Transformer就是ChatGPT的智慧天花板。当然Transformer也有前辈,这里之所以溯源到Transformer,因为Transformer代表了过去和未来一段时间语言技术革命的标志性成果。
Google用Transformer搭建了谷歌的在线翻译机器人,为什么没有像ChatGPT那样石破天惊呢。两个原因,一是在线翻译做为一个传统科技领域,受众面小,二是在线翻译没有因为引入Transformer在翻译水平上带来革命性的变化。
一个不争的事实,长期以来,我们在机器视觉领域取得了很大的工业突破和产业价值,但在语言智能领域则相对滞后,机器翻译这类勉强可用的成果显然满足不了人类追求。ChatGPT做为聊天应用,太大众化了,太接地气了,进一步打开了人们的想象空间和期待。事实上,科技圈有个共识,人工智能什么时候能过了“语言交流”这一关,才算是一个划时代的突破。
那么ChatGPT突破了“语言交流”这一关吗?从各种测试反馈来看,至少在应用层面和用户体验上,确实突破了“语言交流”的浅层表象这一关,至于ChatGPT是如何做到的?是如何解决用户的问题的?ChatGPT会成长(更聪明)吗?其成长的“养料”是什么?成长代价是什么?这些需要我们做出深度思考和判断。
其实,要搞懂上述问题,做为学生来讲,我们首先要思考,机器是如何学习说话的,机器是如何学会说话的。机器说话的逻辑显然与人类不同,人类是生物信息,机器是二进制数字电路。
要搞懂机器说话的模型,只有理论显然不行,事实上,我们可以自己动手,从零开始去做一个Mini版的聊天机器人程序。
当学生们看到自己用Transformer+中文数据集训练的聊天程序时,再来看ChatGPT,或许会有 “荡胸生曾云,决眦入归鸟”的豁然开朗吧。(参见文后的授课视频)
当我们做了上述探索与实践之后,或许你会发现,就当下而言,所有的人工智能,都是一种工具化的表达,与人类智能还是天壤之别的。语言模型的本质上仍然是基于现实世界的文字,建立单词之间的关系,输入一句话,预测下一个可能出现的词语,或者可能出现的一段话。这在我们自己动手做的机器人聊天程序上体现得尤为深刻。
对于ChatGPT而言,其能力更强了,可以帮助程序员排错,可以多轮对话,将话题导向深入,这里暂且不论其能力的可靠性和正确性,现在重点探讨其智能本质。
不妨将ChatGPT与搜索引擎的能力做个对比,确实,ChatGPT目前的表现,可以给出目前搜索引擎无法完成的回答,因为搜索引擎是对“知识库”检索,而ChatGPT是已经把“知识库”做成了自己的结构基因(就是那海量的训练好的模型参数),ChatGPT可以自豪地说,我不是“知识库”的搬运工,我是经过自己“思考”后的回答,这样一看,貌似ChatGPT更胜一筹。但是,搜索引擎有庞大的爬虫团队夜以继日的工作,搜索引擎的知识库是与时俱进的。但是ChatGPT如果也想每时每刻都在进步和成长,这意味着首先ChatGPT赖以训练的原始“知识库”需要实时更新,同时模型需要实时迭代训练(这个代价不是一般的大),毋庸置疑,ChatGPT的成长代价极其高昂。
即便如此,成长到一定水平的ChatGPT,仍然可以转化为落地应用。特别是针对某些行业的智能助理或者智能客服而言,可以形成更好的商业体验与人力替代。
ChatGPT能够编程,能够写论文,能够写新闻,我们也必须明白,这些成果与人类的创造性相比,不会“高明”到哪里去,但是却有借鉴意义,就像AlphaFold一样,给出的蛋白质结构,即便极其准确,也需要实验验证。事实上,没有人能够说清楚,ChatGPT的推理逻辑是什么?人类给出了机器学习说话的算法逻辑和实现但是却解释不清楚模型内部的训练过程。因为整个深度学习,还是黑盒,语言模型的生成逻辑,还有诸多不可解释性待解。
最近媒体上看到斯坦福的教授(Michal Kosinski)说ChatGPT相当于9岁儿童的“心智水平”。我不知道他的评价依据和逻辑,其实,我更愿意认为ChatGPT没有“心智”,因为他需要不断的外力注入(知识库更新和重新训练),至于“知识水平”,显然不是9岁儿童可以做到的。
媒体报道,比尔盖茨断言ChatGPT与互联网的发明一样重要,未来将改变世界。当下从产业的角度看,我认为,ChatGPT可能会比肩搜索引擎对产业的影响。至于ChatGPT需要多久,才会嵌入到各种应用平台上,边缘计算设备上,拭目以待吧,毕竟ChatGPT出身豪门,我们可以用几个小时做出前面的Transformer聊天机器人,但是缔造ChatGPT这种级别的应用,当下,非一流大型科技公司玩不转,即便BAT现在想仿制ChatGPT,恐怕是不能一蹴而就。到时候这里还有个比较问题,谁是更强者,是否要像AlphaGo那样分个高下,人机对战或者机器之间对战。
烧钱搭建高端算力平台,还得有大型知识库储备,最关键的是ChatGPT的模型算法和训练方法。虽然ChatGPT的基因源于GPT和Transformer,但是,其全新的架构和实践逻辑,仍然不是可以简单模仿的。所以中国版的ChatGPT何时问世,不好预测,百度的文心一言(中国版ChatGPT),据说3月份可以公测,值得期待。
搞定ChatGPT需要做哪些技术储备?对于学生而言,我认为先把这门课的基础学好,然后能够独立实践做出上述的Mini版聊天机器人。即便我不告诉你需要做哪些技术储备,你也已经会自行探索,有的放矢了。
不知道ChatGPT还会在媒体圈、科技圈高热度持续飞行、发酵多久,我想,即便到了2024年,2025年,即便在这两年的时间里,ChatGPT本身的能力没有突破,那么再说起来ChatGPT,仍然具有代表性,因为至少他让人类看到了语言模型从不好用到可以用的希望,或许这两年或者不久的将来,ChatGPT真的能像搜索引擎一样,落地生根,不可替代。
我给朋友们提供一个测试思路,举个例子吧。假设ChatGPT是2019年11月诞生的,2020-2022这三年,满世界都是关于新冠的话题,但是ChatGPT诞生时,奥密克戎这个词根本没有出现过。现在,到了2023年,此时,你可以问他一些关于奥密克戎的问题(假设ChatGPT仍然是2019年的水平,此后三年知识库没有更新过,即没有用包含奥密克戎的知识训练过),问题:奥密克戎如何防治?有哪些特点?我相信他无法回答,甚至左顾而言他,或者会答复你人类目前未有解决方案(这已经是最聪明的回答)。所以,ChatGPT也需要与时俱进。沿着这个思路,可以窥见ChatGPT的创造力、智慧力到底几何。当然,现在问诞生于2022年11月的ChaGPT,奥密克戎问题难不住他的。
总之,ChatGPT的聪明与人类的聪明有质的不同,ChatGPT的学习成长路径与人类的成长学习路径也几乎不具可比性。ChatGPT的聪明弹性很小,人类的聪明弹性很大。尽管如此,ChatGPT仍是科技时代的一缕曙光,ChatGPT本身更多的是在实践层面具有突破性和标志性,他让那些长期在语言理解领域跋涉探索的科技达人们平添更多信心,激发了千行百业的从业者们更具活力的创造热情,让不懂人工智能的烟火百姓们,对科技之未来平添更多的憧憬、膜拜和热爱。
2023年2月18日,随笔
视频1:Transformer与人机聊天,2021年7月,桂林
机器是如何学习说话的?
https://v.qq.com/x/page/e32675uj1rq.html
Android机器人聊天
https://v.qq.com/x/page/n3267yd005e.html
视频2:Transformer与人机聊天,2021年9月,Google教育部协同育人线上项目。
https://www.bilibili.com/video/BV13T411U7qS/?spm_id_from=333.337.search-card.all.click
2022年8月重新录制整理到新书中。
对ChatGPT和AIGC等内容感兴趣的读者,可以关注我们即将上线的新书。
新书推介:TensorFlow+Android经典模型从理论到实战(微课视频版)
预计2023年3月出版。