欢迎光临散文网 会员登陆 & 注册

多么行|让人人都能训练模型

2023-07-19 20:03 作者:5555754654  | 我要投稿

2023年为AIGC爆发的元年,有人将ChatGPT这类的LLM称之为改变人类的发明,据瑞银发布的一份研究报告显示,自ChatGPT推出两个月后,月活跃用户已达约1亿,成为历史上增长最快的消费应用。ChatGPT的功能强大这点毋庸置疑,但GPT模型该如何落地使用,是很多企业正在遇到的问题。

很多企业已经意识到,AIGC在内部办公、客服、市场的应用前景,对内提高人效,对外为业务赋能,目标很明确,但难在最后一步,AIGC如何落地?AIGC能否提供安全、合规、可控的服务?

基于这些问题,多么行给出了答案。

多么行推出了无代码的模型训练平台,基于向量搜索+LLM 线性问答的模式,构建与模型对应的知识库,并通过在线输入或导入文件等方式将知识添加到其中。平台会自动对您的知识库进行训练和处理,让模型基于知识库中的内容去理解和回答问题。这样就解决了GPT应用难、管控难的问题。

为了让大家更深入地了解构建知识库的原理,以及如何利用知识库更好地训练模型,我们给大家带来了一点使用小技巧。

先创建应用

专属AI机器人有知识库应用两部分组成,应用可以被理解为AI机器人的学习能力、表达能力、表达风格和表达方式等。

再创建知识库

知识库可以被比喻为一个AI的大脑。这个知识库是一个存储和整理知识的地方,就像我们的大脑记住了很多知识和经验,AI的知识库也存储了大量的数据,当我们与AI对话时,AI将会结合您创建的知识库内容进行检索。

  • 打开应用界面,并点击侧栏上方的知识库选项。

  • 在知识库界面中,点击右上方的+图标,以展开操作界面。

  • 导入知识库数据,系统会自动训练数据。当下方出现数据,代表已经训练成果了。此时在应用中将数据库与应用关联了!

请注意,确保导入的知识库内容准确、完整,并符合您的应用需求。建议在导入数据前对数据进行整理,检查错别字、语法错误、过期信息等。

可以导入的数据类型:

  • 点击导入按钮,提供三种导入方式:

  • 手动输入:可以手动输入知识库的内容,包括问题和回答。

  • 文本/文件拆分:如果知识库内容已经以文本或文件的形式存在,选择此选项进行导入。系统将自动将文本或文件拆分成问题和回答,并展示在下方。

  • CSV问答对导入:如果已经准备好了CSV格式的问答对数据,可以选择此选项进行导入。

训练效果调试:

  • 搜索测试界面:

  • 在搜索测试界面,可以对知识库进行检索测试。

  • 输入问题或关键词后,右侧将显示检索结果。

  • 可以点击每个知识点,直接进入编辑界面,对内容进行修改。

数据微调:

如回复不准确,可以对数据进行微调。点击数据管理界面

  • 导入知识库后,下方将显示已拆分和训练好的知识点。可以点击每个知识点,进入编辑界面进行修改。

  • 在编辑界面中,可以设置“匹配的知识点”,这些知识点将用于对话和回复时的内容检索。同时,还可以在“补充知识”中添加内容,这些内容不会被检索,但会作为参考回答时使用。

  • 如果需要导出整个知识库的内容,可以点击导出CSV按钮,将数据库导出为CSV格式。

如何管理知识库内容:

在基本信息界面,我们可以对每个知识库进行自定义知识库的头像、名称和分类标签。


多么行|让人人都能训练模型的评论 (共 条)

分享到微博请遵守国家法律