SPSS的线性回归分析
一、 实验目的
掌握线性回归分析的基本思想和具体操作,能读懂分析结果,并写出回归方程,对回归方程进行各种统计检验。
二、实验题目
1、给定“高校科研研究数据”,建立课题总数影响因素的回归方程。
(1)解释变量采用强制进入策略(Enter),并做多重共线性检测;
(2)解释变量采用向后筛选策略让SPSS自动完成解释变量的选择。
2、一般认为,一个地区的农业总产值与该地区的农业劳动力、灌溉面积、化肥用量、农户固定资产、农业机械化水平等因素有关。下表为某年我国北方地区12个省市的相关数据。试建立我国北方地区的农业产出线性回归模型,分析影响农业产出的主要因素,并说明理由。

三、实验步骤和结果分析
1.(1)
运行软件,输入数据
选择菜单分析>回归>线性,弹出线性回归参数设置窗口
因变量:课题总数
自变量:专著数,论文数,获奖数
方法:进入(表示所有的自变量都进入模型)
选择选项,就模型残差进行Durbin Watson检验,用于判断残差是否独立,作为一个基础条件来判断数据是否适合做线性回归,选定【共线性诊断】
过程及结果如下图所示




下图第一个表格第3列R方为判定系数,一般认为需要大于60%,用于判定线性方程拟合优度的重要指标,体现了回归模型解释因变量变异的能力,越接近1越好。从结果中可以看出值为0.939,初步判断模型拟合效果良好
第二个表格方差分析的显著性值=0.000<0.01<0.05,表明由自变量和因变量“课题总数”建立的线性关系回归模型具有极显著的统计学意义,即其线性关系显著
第三个表格看自变量的回归系数是否通过检验,t检验原假设回归系数没有意义,由Sig.一列回归系数显著性值若<0.01<0.05,表明回归系数b存在,有统计学意义,即为正比关系,而且极显著
其中共线性诊断的部分在“共线性诊断”,如果条件指数>10,则表明有共线性。图中的条件指数高>10,可属见共线性存在


模型残差独立性检验:DW=1.838,查询 Durbin Watson table 可以发现本例DW值恰好出在无自相关性的值域之中,认定残差独立,通过检验。
1.(2)
运行软件,输入数据,
“向后筛选”方法,依次剔除的变量是专著数、投入高级职称的人年数、投入科研事业费、获奖数、论文数。最后的模型结果是“立项课题数=-94.524+0.492x投入人年数”
选择菜单分析>回归>线性,弹出线性回归参数设置窗口
因变量:课题总数
自变量:投入人年数,投入高级职称的人年数,投入科研事业费
由库克距离(0.041小于1)和杠杆指变量的值知,没有显著的差异。
残差点在0线周围随机分布
过程及结果如下图









模型残差独立性检验:DW=1.747,查询 Durbin Watson table 可以发现本例DW值恰好出在无自相关性的值域之中,认定残差独立,通过检验。
2.
运行软件,输入数据
选择菜单分析>回归>线性,弹出线性回归参数设置窗口
因变量:农业总产值
自变量:浇灌面积,化肥用量,农机动力
方法:逐步
勾选内容如第二张图
过程及结果如下图所示





拟合优度系数接近1,说明拟合度好。存在多重线性。化肥用量p值<0.05.说明线性显著。线性回归方程:y=19.501+1.526x