数据预处理之均值移除
什么是均值移除(标准化):
由于一个样本的不同特征值差异较大,不利于使用现有机器学习算法进行样本处理。均值移除可以让样本矩阵中的每一列的平均值为0,标准差为1。 确保每一个特征列的数值都在类似的数据范围之间,防止某一个特征列数据天然的数值太大而一家独大影响结果。
知识点
均值移除API:
import sklearn.preprocessing as sp
# scale函数用于对函数进行预处理,实现均值移除。
A = sp.scale(array)
案例如下:
