欢迎光临散文网 会员登陆 & 注册

[Lora训练-ChatGLM]如何构建自己的数据集?

2023-07-30 11:30 作者:独立研究员-星空  | 我要投稿

{"instruction": "", "input": "", "output": ""}

这个叫指令模板,instruction代表要让语言模型去干什么。input大部分情况下为空,output就是期望语言模型的输出。

{"instruction": "今天星期几?", "input": "", "output": "今天星期一"}

{"instruction": "1+2等于几?", "input": "", "output": "1+2等于3"}

每行一条数据,不能有换行,换行可以用\n表示

{"instruction": " 每个班里有 18 名学生,学校有 5 个班级,请问学校一共有多少名学生?", "input": "", "output": "要算出学校一共有多少名学生,需要将每个班级的学生人数都加在一起。由于学生数量都是 18 个,所以可以将 18 个学生分别乘以 5 个班级。即:18 x 5 = 90,所以学校一共有 90 名学生。\n答案:学校一共有 90 名学生。"}

这是一个样例,只有"instruction"和"output"有值,换行用\n表示。


[Lora训练-ChatGLM]如何构建自己的数据集?的评论 (共 条)

分享到微博请遵守国家法律