欢迎光临散文网 会员登陆 & 注册

【渐构】万字科普GPT-4为什么会颠覆人类社会

2023-03-16 00:06 作者:尤子鹿  | 我要投稿

时间:20230315

up主YJango老师提前说明:

视频是关于GPT的底层原理和未来影响。

将抛开技术细节,少用专业名词,在整体功能上讲解 ChatGPT 的

「工作原理」「制造过程」「涌现的能力」「未来的影响」以及「如何应对」:


1、ChatGPT是如何回答问题的

2、它是怎么被制造的,为什么它不是搜索引擎

3、它有哪些惊人能力,为什么它不只是聊天机器人

4、它将给社会带来什么样的冲击

5、我们该如何维持未来的竞争力


视频内容:




00:59

底层原理

2.1实质功能:【单字接龙】

(给定任意长的上文,它会根据自己的模型生成下一个字

⭐如何回答长内容的?

——




即:自回归生成

影响因素两个:上文+模型


02:45

2.2 训练方式

训练模型,方式是给一份学习材料来做单字接龙,然后不断调整

如果同时训练了两份都是“白日”开头做上文的不同材料——

那么遇到“白日”,生成?

生成的下一个字就是按照概率分布抽样得到的结果



04:52


Above,都是说了由上文按照概率分布生成了下文,即做到【补全或续写】,那它是怎么回答问题的?


↓(将二者组合成一个问答范例)

不需要将所有的组合都灌给chatGPT,训练的目的并不是记忆,而是学习

在训练之前,数据库已经将所有信息都记忆好了


非要训练单字接龙——




驱使它建构三个提问的通用规律

经过这种训练,即使它遇到没有记忆过的提问时,也能举一反三,生成它通用模型的内容


07:11

混淆搜索引擎

训练过程中,学习材料并【没有被保存】在模型中。学习材料的作用是【调整模型】

ChatGPT相较搜索引擎的短板:

搜索引擎不会混淆记忆,它会


它的内容无法被直接增删改查

无法直接操作→存在隐患,

要不断调整模型训练才能校正它的所记所学→更新时的效率降低

③高度依赖数据(即学习材料)

否则回答会以偏概全或存在胡编混淆


11:14



11:42

三步训练




让机器理解人类语言的难点在于——

解决方法↓

阶段1:开卷有益

P: pre-training,预训练

2018年6月,GPT-1

2019年2月,GPT-2

2020年5月,GPT-3



GPT-1在一些任务的表现上,不如后来的BERT:GPT的学习方式是单字接龙,BERT是完形填空



15:14

但回答形式和内容不受约束!


由此,进入阶段 2


15:59



17:19


答:


18:26


理解例子产生回答↓ 【语境内学习


20:24

分治效应







22:26




由此,进入↓


23:30

阶段3 创意引导

其中的三个阶段的专业称呼是↓


23:53

总结:


也回答了↓


25:08

未来的影响







它相当于试点火试验

我们接下来讨论的焦点:




它不仅精通语言,真正有价值的是,在此基础上,还能存储人类从古至今的世界知识

人类个体的知识会随着个体死亡而断掉,语言的发明让知识可以传承








39:48

总结一下



40:38

5 如何应对

















【渐构】万字科普GPT-4为什么会颠覆人类社会的评论 (共 条)

分享到微博请遵守国家法律