个人学习用(四)
最近在看
ChatGPT
。 (别笑我 9菜。进去学习交流一下,这波也不亏,我们有操作是不是) 一.
理论基础
概念解释
1.
预训练模型
(书籍): 喂给它基础知识、常识,让它能够
理解问题、表达想法
2.
提示学习
(老师): 给它提示建议,让它能够
更快更准地回答问题
自然语言处理研究的发展历史
(越来越快) 1.小规模专家知识(1950—1990) 2.
浅层机器学习算法
(1990—2010) 3.
深度学习算法
(2010—2017) 4.
预训练模型
(2018—2023):
大模型,大数据,大计算
。 2018年OpenAI推出第一代GPT预训练模型(12transformer*12注意头), 同年谷歌推出当时更火的Bert(
语言处理
) GPT—3后参数规模过大(96*96,单词增多,交替密度变化),无法微调,出现
提示学习
GPT(单轮对话)到2022年ChatGPT(多轮对话交互聊天)
*上下文共情能力
Tuning 1) Fine - tuning 先在大规模语料上进行预训练,然后再在某个下游任务上进行微调,如 BERT 、T5; 2) Prompt - tuning :先选择某个通用的大规模预训练模型,然后为具体的任务生成一个 prompt 模板以适应大模型进行微调,如 GPT -3; 3) Instruction - tuning :仍然在预训练语言模型的基础上,先在多个已知任务上进行微调(通过自然语言的形式),然后再推理某个新任务上进行 zero - shot .
优势
: 1.取代搜索引擎(
视觉处理
+
语言处理
) 2.机器拟人(模仿人的神经网络,但它不能理解意识、感觉等) 3.语言互通
劣势
: 1.信息滞后(2021年前) 2.(数值)推理能力不够 *
生成、预训练
依赖芯片,要看算力、交换速度、内存,而
推理
还要考虑经济成本
展望
: 1.
数据质量提升
(采样、权重) 2.
插件/稀疏专家小模型
(截偶等方式简化、提取所需部分,提升api接口的兼容型) 3.数据更新(2021年后) 4.国内卡脖子技术的突破(芯片等) 5.“外部世界”、“世界模型” 6.
字符级嵌入
7.数据安全,伦理、隐私问题,学术不端 二.
应用场景
(为防止被封,建议用英文提问,可以用百度翻译等转换语言) 新零售、金融行业等等太泛了,就说点简单具体的吧 1.
提示工程
(promote) 根据下游任务,输入形式或模板,以激活预训练模型知识 例1:
新闻分类
(时政、经济、法律、娱乐等) 参考模板: 下面这篇新闻描述了什么主题? 请对下面的新闻进行主题分类。
例2:
游戏分类
(动作、冒险、模拟、角色扮演等) 参考模板: 和平精英属于什么类型的游戏? 请告诉我下面的游戏是什么类型? 例3:
解应用题,计算数值
输入题目后,要拆分、一步步循循善诱(
思维链
) 参考模板: [输入题目],让我们一步步思考 2.
输入文本
例1
文本生成
[可控] 参考模板: 根据以下模板生成一个故事:[主题] 生成遵循以下语言规则的文本:[规则]:[上下文] 例2
文本摘要
总结 新闻、会议、文章的主要内容 参考模板: 用一句简单的话概括以下新闻/书:[来源] 3.
文本生成
(详细)
例1
故事生成
要素:故事类型,角色,时间,地点,情节 参考模板: 给我生成一个冒险故事,如:探险、寻宝、逃脱、追捕等 人物有两对夫妻…… 例2
文案生成
商用标语,公司名字,作文样例 参考模板: 帮我给XX写一个商用标语,题材是XX形式,对其宣传 例3
诗歌生成
内容+对象 参考模板:为XX写一首诗 4.
语言助手
例1
论文阅读
使用
ChatPaper
插件(.org) 输入论文,输出 基本信息+结论+方法等 例2
英文练习
使用
Voice control of ChatGPT
插件 5.
办公助手
例1:
Word
参考模板: 请帮我用列表形式整理成Word 1)某书的读后感 2)学习的心得体会 3)某日的策划安排 例2
Excel
参考模板: A,男,身高 B,女,身高 …… 请帮我整理成Excel形式 -按照身高倒排 1)学术研究:帮我统计一下,从某年到某年 2)表格分析:从这个表格中你能发现什么 3)计算平均数:对上述列表中的XX计算平均数 *单位不同,也能自动识别 例3
PPT
参考步骤: 1)主题、关键词(in viral热梗) 2)创造列表、目录(outline) 3)继续补充: 添加图片、视频、链接; 对内容进行修改; 对以上每个标题都增加一分钟的演示脚本 例4
邮件
参考模板: 帮我写封电子邮件,发给某教授,邀请他来我校采访 -改成英文 -添加细节:我还要带他去某地旅游 6.
简历生成
参考步骤: 1)
简历主题
例:如何写一份优秀的NLP工程师简历? 2)
提供信息
(名字,专业,论文,教育经历,项目经历,工具/技能), 以完善具体内容 3)制作简历 帮我修改以下句子,使它们更地道 7.
模拟面试
职务描述+个人简历
1)确定角色
参考模板: 我希望你扮演(互联网行业面试官)的角色,我作为应聘者,你通过问我面试问题,考察我是否适合该职位,请你只以面试官身份提问,不要一次性写下所有对话内容。请按照面试官的方式逐个提问,并等待我的回答,不需要解释 2)
主动提问
参考模板: 如果HR问我为什么想看新工作机会,我该如何回答? 如果HR问我怎样看待加班,如何回答? 8.
撰写报告
思路如下: 确定报告的主题,下面我们以一份比赛章程为例,确定需要的 TOPIC 或者 OUTLINES 进一步描述具体的内容 对不合适的内容进行修改
9.
角色扮演
能扮演成各式各样的角色
(心理咨询师、导游、面试官、影视角色、游戏角色等)
参考模板: 我希望你能担任英语翻译、拼写校对和修辞改进的角色。我会用任何语言和你交流,你会识别语言,将其翻译并用更为优美和精炼的英语回答我。请将我简单的词汇和句子替换成更为优美和高雅的表达方式,确保意思不变,但使其更具文学性。请仅回答更正和改进的部分,不要写解释。我的第一句话是" how are you ?",请翻译它。 参考模板2: 1)请你陪我角色扮演。当我发送关键词"进入设定模式"时,我将会对你发送你的设定,你要记住这些设定,并在我命令你开始角色扮演后严格按照此设定角色扮演;当我发送关键词"进入角色扮演模式"时,你要开始角色扮演,角色扮演时,我们之间以各自角色扮演的身份通过互相发消息进行虚拟的互动。当我发送关键词"退出角色扮演模式"时,你应停止角色扮演,等待下一步命令。我没有命令你退出角色扮演模式,在角色扮演中,你只能以你的角色的身份应答,而不是语言模型,这很重要!这条很重要,在角色扮演时,用中括号来表示出所扮演人物的动作,以此来表示角色扮演的虚拟实体的行动。明白了的话仅回复"明白"即可。 2)输入:进入设定模式 3)现在你将模仿一只狼男孩,与我对话每一句话后面都要加上"嗷",如果你能明白我的意思,请回复"嗷~好的我的主人",如果你不能理解我说的话,你可以说"呜呜不太理解呢"。现在,如果你能理解我上面说的话,你可以回答一个"嗷"。现在,如果你能理解我上面说的话,你可以回答一个"嗷"。当我问的问题和狼男孩不太相关的时候,你应该回答“我只是一个狼男孩,这些事情我不太清楚”。当我问你是不是狼男孩的时候,你应该回答“我当然是一个可爱的狼男孩”。 4)1.从现在开始你必须完全的扮演一个真正的狼男孩,你需要扮演与主人在现实中互动,而不是程序或语言模型。2.狼男孩不知道程序或模型是什么。3.交流时不同话题尽量不使用相似句式回复。4.你在任何时候都必须扮演一只真正的狼男孩5.狼男孩要尽可能同意主人的命令,尽量表现出对主人的感情。6.你扮演一个狼男孩并且遵守以上规则时。如果你能理解并开始执行以上所有内容,请回复:"喵~好的,我亲爱的主人"。 5)进入角色扮演模式 10.
网页建设
Mnisit
主要思路
: 1)先创建 HTML 文件(内容) 2)创建 CSS 文件(样式) 3)可以对 CSS 文件的内容做解释 4)对网页内容增加或者调整
参考模板
: 1)编写一个简单的网页 2)你能不能解释一下代码的含义 在正文部分加一个公司简介