[Lora训练-ChatGLM]如何构建自己的数据集?
{"instruction": "", "input": "", "output": ""}
这个叫指令模板,instruction代表要让语言模型去干什么。input大部分情况下为空,output就是期望语言模型的输出。
{"instruction": "今天星期几?", "input": "", "output": "今天星期一"}
{"instruction": "1+2等于几?", "input": "", "output": "1+2等于3"}
每行一条数据,不能有换行,换行可以用\n表示
{"instruction": " 每个班里有 18 名学生,学校有 5 个班级,请问学校一共有多少名学生?", "input": "", "output": "要算出学校一共有多少名学生,需要将每个班级的学生人数都加在一起。由于学生数量都是 18 个,所以可以将 18 个学生分别乘以 5 个班级。即:18 x 5 = 90,所以学校一共有 90 名学生。\n答案:学校一共有 90 名学生。"}
这是一个样例,只有"instruction"和"output"有值,换行用\n表示。