QQ图:由标准正态的分位数为横坐标,样本为纵坐标绘制而成的散点图
stats包中的probpbt函数绘制QQ图
可以看到,saleprice的分布呈正偏态,而线性回归模型要求因变量服从正态分布。对其使用对数变换,让数据接近正态分布
用numpy中的loglp函数
通过seaborn包中的heatmap函数绘制相关性矩阵热图