欢迎光临散文网 会员登陆 & 注册

SixSigma工具 | 多重线性回归的适用条件

2022-09-05 16:05 作者:天行健六西格玛  | 我要投稿

多重线性回归模型作为一种统计模型,它有严格的适用条件,在建模时也需要对这些适用条件进行判断。但是许多使用者往往忽视了这一点,在使用过程中只是单一的构建模型,最终很有可能得出错误的结论。因此在应用多重线性回归之前,我们应该了解它需要满足哪些前提条件呢?

天行健六西格玛顾问总结可用4个词来概况:线性(Linear),独立(Independence),正态(Normality),齐性(Equal variance),缩写为LINE原则。

(1) 线性:各自变量xi与因变量yi之间存在线性关系,可以通过绘制散点图来进行判断;

(2) 独立:因变量yi的取值之间相互独立,反映到回归模型中,实际上就是要求残差ei之间相互独立;

(3) 正态性:构建多重线性回归模型后,残差ei服从正态分布;

(4) 方差齐性:残差ei的大小不随xi取值水平的变化而变化,即残差ei具有方差齐性。

只有准确把握了LINE核心原则,才能够保证构建符合统计学要求的多重线性回归模型。但是,由于多重线性回归模型具有一定的“抗偏倚性”,如果只是想通过构建方程来探讨自变量和因变量之间的关联性,而非对因变量进行预测,那么后面两个条件可以适当放宽。

此外,还应该注意以下几点:

(5) 因变量yi为连续性变量,而非分类变量;

(6) 自变量xi可以为连续变量,也可以为分类变量,当自变量为多分类无序变量时,则需要设置哑变量,当为有序变量时,则需要根据等级顺序进行赋值。

(7) 对于自变量xi的分布特征没有具体的限定,只要求自变量xi间相互独立,不存在多重共线性;

(8) 对于样本量的要求,根据经验一般要求样本量应当为纳入模型的自变量的20倍以上为宜,比如模型纳入5个自变量,则样本量应当在100以上为宜。


SixSigma工具 | 多重线性回归的适用条件的评论 (共 条)

分享到微博请遵守国家法律