欢迎光临散文网 会员登陆 & 注册

唐宇迪python-机器学习-进阶实战

2023-03-04 14:02 作者:bili_1559000721  | 我要投稿

Step2: Data Preprocessing

数据预处理,就是将数据处理下,为模型输入做准备,其中包括:

  • 处理missing value:这里学问有点深,如果各位有好的经验可以跟我交流下。以我浅薄的经验来说我一般会分情况处理

    1. 如果missing value占总体的比例非常小,那么直接填入平均值或者众数

    2. 如果missing value所占比例不算小也不算大,那么可以考虑它跟其他特征的关系,如果关系明显,那么直接根据其他特征填入;也可以建立简单的模型,比如线性回归,随机森林


唐宇迪python-机器学习-进阶实战的评论 (共 条)

分享到微博请遵守国家法律