SixSigma——多元回归有哪些基本概念?
六西格玛(SixSigma)的世界总是那么晦涩难懂,我们慢慢嚼烂它.

1. 什么是多元回归?
多个自变量的回归问题就是多元回归
2. 什么是多元线性回归?
因变量和自变量线性关系时,为多元线性回归
3. 最后那个误差项是什么意思?
误差项就是自变量无法解释的变异部分

4. 多元回归有假定条件吗?
有,现有的分析都有假设条件,没有就没法分析。
a. 误差项的期望为0
b. 误差项的方差都相等
c. 误差项服从正态分布N(0,?2)
6. 什么是估计回归方程?
和一元回归方程一样,多元回归方程用样本去估计系数β(1,2….n),就叫估计回归方程。
5. 它表示什么意思呢?
他表示在因变量中y的变差 被 估计回归方程 能解释的比例。
6. 什么是多重共线性?
当回归方程中多个自变量之间,彼此存在相关,就会提供多余的信息,在预测中提供的信息也就是重复的,就称为多重共线性。

7. 为什么存在多重共线性不好?
因为变量之间存在关系,会使回归的结果混乱。可能使回归系数βi的正负号相反。
当存在多重共线性,对回归系数的解释是非常危险的。
8. 如何判定多重共线性?
a. 模型中各对自变量之间显著相关
b. 当模型的线性关系F检验显著时,几乎所有回归系数βi的t检验却不显著
c. 回归系数的正负号与预期相反
d. 容忍度与方差扩大因子VIF (variance inflation factor) VIF 越大,多重共线性越严重,一般大于10时,存在严重的多重共线性。