使用qq聊天记录训练一个自己的对话机器人
使用qq聊天记录训练一个自己的对话机器人
需要提前准备的有可靠的python环境、cuda环境等、本地已经部署好的chatglm-6b模型(本地模型,不用担心聊天记录被上传)、qq电脑版、还有一个能把qq聊天记录格式转化成一问一答格式训练集的脚本。
其中脚本是我昨天写的,我会提供给大家(我python水平其实不咋地,能用就行大家见谅)
脚本地址:https://github.com/liuhr144/qq/tree/main
chatGLM-6b官方开源地址:https://github.com/THUDM/ChatGLM-6B
而其他准备需要大家自己去完成,如果有什么报错没法解决请留言,我会尽力帮助。
那么正式开始!
1.在这个qq设置界面打开消息管理

2. 选择云消息设置漫游数据(7天就行。开会员也行)

3. 选择导出消息记录(注意要为txt格式)


4.之后改名为test1.txt(也可按照脚本内注释改脚本不改这个)

5. 按照脚本中的注释修改参数

6.运行脚本得到两个json文件(记得检验json内容哈)

7.复制这两个文件去微调的训练集目录(如图)

8.通过cmd执行训练并等待训练完成


9.通过cmd执行推理并等待推理完成


10.运行web_demo进行对话

这样,一个像自己说话方式的对话机器人就弄好了,去和朋友对话看看他们能否发现吧
(真是恶趣味)
效果如图:还凑合?


谢谢大家观看!