爱数据 数据产品经理入职解决方案
第一步:数据审查
该步骤检查数据的数量(记录数)是否满足分析的最低要求,变量值的内容是否与研究的要求一致,是否全面,包括利用描述性统计分析,检查各个变量的数据类型,变量值的最大值、最小值、平均数、中位数等,数据个数、缺失值或空值个数等。
第二步:数据清理
该步骤针对数据审查过程中发现的明显错误值、缺失值、异常值、可疑数据,选用适当的方法进行“清理”,使“脏”数据变为“干净”数据,保证后续的数据分析得出可靠的结论。当然,数据清理还包括对重复记录进行删除。
第一步:数据审查
该步骤检查数据的数量(记录数)是否满足分析的最低要求,变量值的内容是否与研究的要求一致,是否全面,包括利用描述性统计分析,检查各个变量的数据类型,变量值的最大值、最小值、平均数、中位数等,数据个数、缺失值或空值个数等。
第二步:数据清理
该步骤针对数据审查过程中发现的明显错误值、缺失值、异常值、可疑数据,选用适当的方法进行“清理”,使“脏”数据变为“干净”数据,保证后续的数据分析得出可靠的结论。当然,数据清理还包括对重复记录进行删除。