多么行|让人人都能训练模型
2023年为AIGC爆发的元年,有人将ChatGPT这类的LLM称之为改变人类的发明,据瑞银发布的一份研究报告显示,自ChatGPT推出两个月后,月活跃用户已达约1亿,成为历史上增长最快的消费应用。ChatGPT的功能强大这点毋庸置疑,但GPT模型该如何落地使用,是很多企业正在遇到的问题。
很多企业已经意识到,AIGC在内部办公、客服、市场的应用前景,对内提高人效,对外为业务赋能,目标很明确,但难在最后一步,AIGC如何落地?AIGC能否提供安全、合规、可控的服务?
基于这些问题,多么行给出了答案。
多么行推出了无代码的模型训练平台,基于向量搜索+LLM 线性问答的模式,构建与模型对应的知识库,并通过在线输入或导入文件等方式将知识添加到其中。平台会自动对您的知识库进行训练和处理,让模型基于知识库中的内容去理解和回答问题。这样就解决了GPT应用难、管控难的问题。
为了让大家更深入地了解构建知识库的原理,以及如何利用知识库更好地训练模型,我们给大家带来了一点使用小技巧。
先创建应用
专属AI机器人有知识库
和应用
两部分组成,应用可以被理解为AI机器人的学习能力、表达能力、表达风格和表达方式等。

再创建知识库
知识库可以被比喻为一个AI的大脑。这个知识库是一个存储和整理知识的地方,就像我们的大脑记住了很多知识和经验,AI的知识库也存储了大量的数据,当我们与AI对话时,AI将会结合您创建的知识库内容进行检索。
打开应用界面,并点击侧栏上方的
知识库
选项。

在知识库界面中,点击右上方的
+
图标,以展开操作界面。导入知识库数据,系统会自动训练数据。当下方出现数据,代表已经训练成果了。此时在应用中将数据库与应用关联了!

请注意,确保导入的知识库内容准确、完整,并符合您的应用需求。建议在导入数据前对数据进行整理,检查错别字、语法错误、过期信息等。
可以导入的数据类型:
点击
导入
按钮,提供三种导入方式:手动输入:可以手动输入知识库的内容,包括问题和回答。
文本/文件拆分:如果知识库内容已经以文本或文件的形式存在,选择此选项进行导入。系统将自动将文本或文件拆分成问题和回答,并展示在下方。
CSV问答对导入:如果已经准备好了CSV格式的问答对数据,可以选择此选项进行导入。
训练效果调试:
搜索测试界面:

在搜索测试界面,可以对知识库进行检索测试。
输入问题或关键词后,右侧将显示检索结果。
可以点击每个知识点,直接进入编辑界面,对内容进行修改。
数据微调:
如回复不准确,可以对数据进行微调。点击数据管理界面
。

导入知识库后,下方将显示已拆分和训练好的知识点。可以点击每个知识点,进入编辑界面进行修改。
在编辑界面中,可以设置“匹配的知识点”,这些知识点将用于对话和回复时的内容检索。同时,还可以在“补充知识”中添加内容,这些内容不会被检索,但会作为参考回答时使用。
如果需要导出整个知识库的内容,可以点击
导出CSV
按钮,将数据库导出为CSV格式。
如何管理知识库内容:
在基本信息界面,我们可以对每个知识库进行自定义知识库的头像、名称和分类标签。
