唐宇迪python-机器学习-进阶实战
2023-03-04 14:02 作者:bili_1559000721 | 我要投稿
Step2: Data Preprocessing
数据预处理,就是将数据处理下,为模型输入做准备,其中包括:
处理missing value:这里学问有点深,如果各位有好的经验可以跟我交流下。以我浅薄的经验来说我一般会分情况处理
如果missing value占总体的比例非常小,那么直接填入平均值或者众数
如果missing value所占比例不算小也不算大,那么可以考虑它跟其他特征的关系,如果关系明显,那么直接根据其他特征填入;也可以建立简单的模型,比如线性回归,随机森林