机器学习实战九天老师菜菜老师训练营
2、数据集划分(70 % ~80%训练 + 20%~30%测试)
sklearn.model_selection.train_test_split(arrays, *options)
(1) 数据集的特征值
(2) 数据集的标签值
(3) test_size测试集的大小,通常是比例e.g 0.2
(4) random_state 随机数种子:如果是不同算法对比,要使得种子一致 -> 划分一致
(5) return 训练集特征值x_train,测试集特征值x_test,训练集目标值y_train,测试集目标值y_test