关于回归分析你知道多少?
回归分析应用广泛,既可以建立输出模型、预测趋势,又可以用来探索影响因素,同时又是最基础、最常见的数据分析方法。要说一定要学会一种分析方法,那回归分析无疑在首推名单之列,因此本文就来讲一讲回归分析。
分类
回归分析是用于研究变量间的影响关系情况,实质上就是研究X对Y的影响关系情况。在线性回归分析中,根据回归模型中X的个数,可将其分为一元线性回归和多元线性回归。
按照Y的多少,又可分为简单回归分析和多重回归分析。
按照X和Y之间的关系类型,可分为线性回归分析和非线性回归分析。
当然这些分类不能完全概括回归分析的类型,在《19种回归分析你知道几种呢?》一文中SPSSAU已经为大家详细的介绍过回归分析的各种分类,以及每种回归分析的用途,这里就不再赘述了。
分析步骤
了解了回归分析的分类之后,我们再以线性回归为例,说一说一般做回归分析的步骤,具体步骤如下:
第一步:首先确定X、Y。
由于回归分析是要分析一个变量如何随其他变量的变化而变化,因此第一步应该确定哪些变量是X(解释变量),哪些是Y(被解释变量),通常X为定量数据,Y定量数据。将对于的题目拖拽到右侧,点击开始分析,即可生成结果。

注意:回归分析之前,可使用SPSSAU提供的箱盒图查看是否有异常数据,或使用散点图直观展示X和Y之间的关联关系。

第二步:对模型情况进行分析

包括模型拟合情况(比如R平方为0.3,则说明所有X可以解释Y 30%的变化原因),模型共线性问题(VIF值小于5则说明无多重共线性),是否通过F检验(F检验用于判定是否X中至少有一个对Y产生影响,如果呈现出显著性,则说明所有X中至少一个会对Y产生影响关系)。
第三步:分析X的显著性
如果显著(p值判断),则说明具有影响关系,反之无影响关系。
第四步:判断X对Y的影响关系方向
回归系数B值大于0说明正向影响,反之负向影响。
第五步:其它
比如对比影响程度大小(回归系数B值大小对比X对Y的影响程度大小)。
回归分析之后,可使用正态图观察和展示保存的残差值正态性情况;或使用散点图观察和展示回归模型异方差情况【残差与X间的散点完全没有关系则无异方差】。

上图是回归分析保存的残差值与自变量作散点图,用于检测异方差性,可以看出,数据基本上没有规律可循,X变化时,Y并不会变大或者变小,因而说明无关联性,也即说明没有异方差性。
具体案例
背景:研究“淘宝客服服务态度”,“淘宝商家服务质量”分别与“淘宝忠诚度”之间的关系情况,此句话中明显的可以看出“淘宝客服服务态度”,“淘宝商家服务质量”这两项为 X;而“淘宝忠诚度”为 Y。
1、确定X,Y。

如果有特别要求,希望保存残差值和预测值,则可将“保存残差和预测值”这项打勾即可,通常情况并不需要。
2、SPSSAU输出结果


其他说明
在实际分析中很可能会出现一些奇怪的现象,比如:有回归影响关系,但是却没有相关关系;或者负向影响关系,但却是正向相关关系。这种情况要怎么办呢?
从分析的角度看,相关分析是研究有没有关系,回归分析是研究影响关系。明显地,相关分析是基础,然后再进行回归分析。首先需要知道有没有相关关系;有了相关关系,才可能有回归影响关系;因而应该先进行相关分析,完成相关分析后,确认有了相关分析,再进行回归分析。
在相关性分析时,结果是两个变量之间的关系,其他变量的影响是不被考虑的;但是,进行回归分析时,如果入选的变量不止一个,那么入选变量之间可以产生影响。因此,普通相关与回归之中的回归系数会有比较大的差别。
如果有回归影响关系,没有相关关系【此时建议以‘没有相关关系作为结论’】
有负向影响关系,正向相关关系【此时建议以‘有相关关系但没有回归影响关系作为结论’】