菜菜九天AIGC大模型实战gpt学习感悟
2023-08-31 14:06 作者:委__no1pptdesign | 我要投稿
#菜菜##九天#什么是GPT模型?GPT代表GenerativePre-trainedTransformer,NLP中的第一个通用语言模型。以前,语言模型仅针对文本生成、摘要或分类等单一任务而设计。GPT是自然语言处理史上第一个可用于各种NLP任务的通用语言模型。现在让我们探索GPT的三个组成部分,即Generative、Pre-Trained和Transformer,并了解它们的含义。【附件笔记百度盘】生成:生成模型是用于生成新数据的统计模型。这些模型可以学习数据集中变量之间的关系,以生成与原始数据集中的数据点相似的新数据点。预训练:这些模型已经使用大型数据集进行了预训练,可以在难以训练新模型时使用。尽管预训练模型可能并不完美,但它可以节省时间并提高性能。Transformer:Transformer模型是一种人工神经网络,创建于2017年,是最著名的深度学习模型,能够处理文本等顺序数据。机器翻译和文本分类等许多任务都是使用转换器模型执行的。编码器确定应强调输入的哪些部分。例如,编码器可以读取“Thequickbrownfoxjumped”这样的句子。然后它计算嵌入矩阵(嵌入在NLP中允许具有相似含义的词具有相似的表示)并将其转换为一系列注意力向量。现在,什么是注意力向量?您可以将Transformer模型中的注意力向量视为一个特殊的计算器,它可以帮助模型了解任何给定信息的哪些部分对做出决策最重要。假设您在考试中被问到多个问题,您必须使用不同的信息片段来回答这些问题。注意力向量可帮助您选择最重要的信息来回答每个问题。在变压器模型的情况下,它以相同的方式工作。[图片][图片]