第十二章 面板数据
12.3 数据集munnell.dta包含美国48个州、1970-1986年的年度数据。为了估计公共资本对经济增长的贡献,使用此数据集进行以下回归...
在比较各回归方法前,首先对面板数据进行设定和统计描述。

使用xtline lny查看各州被解释变量lny随时间year的变动情况。

(1)混合回归结果如下,方程非常显著,R2超过99%,解释能力很强;解释变量lnk2和lnlabor以1%显著,lnk1和unemp以5%显著。

从经济意义上看:在其他条件不变的情况下,公共资本/私人资本存量/非农劳动力/州失业率每增长1%,则州产值平均增加0.16%/0.31%/0.59%/减少0.006%,是比较合理的。
(2)使用FGLS方法的随机效应模型中解释变量lnk1不再显著。

Breusch和Pagan的LM检验用于在混合回归和随机效应模型之间进行选择。检验结果强烈拒绝不存在个体随机效应的假设,因此本例中随机效应模型优于混合回归。

(3)MLE回归结果如下,lnk1仍然不显著。

(4)使用组内估计量的固定效应模型回归结果如下,lnk1不显著,并且系数变为负。

(5)使用LSDV法的单向固定效应模型的回归结果如下(后面的小问中会使用双向固定效应)。lnk1仍不显著,系数为负;在10%的显著性水平下,48个州中只有3个州对应的虚拟变量不显著。为确定个体效应是否随机,需要进一步使用Hausman检验。

Hausman检验用于在随机效应模型和固定效应模型之间进行选择。检验结果在1%的显著性水平下拒绝存在个体随机效应的假设,因此认为本题使用固定效应模型优于随机效应模型。

(7)Hausman检验必须在同方差的条件下才有效,因此FE和RE的回归中均不可以使用聚类稳健标准误。但是否存在异方差需要进行检验。下图中White检验的结果强烈拒绝同方差假设,认为存在异方差,所以需要使用xtoverid命令来进行稳健的豪斯曼检验。


使用xtoverid命令前需要运行“ssc install xtoverid”和“ssc install ivreg2”来安装。教材P258要求“在使用命令xtoverid之前,需先以稳健标准误来执行xtreg,re”,由于xtreg命令的默认参数就是re,所以下面第一种和第三种情况是等价的,但必须使用稳健标准误。检验结果显著,拒绝存在个体随机效应的假设,认为固定效应模型优于随机效应模型。

(8)加入时间趋势项的组内估计法假设双向固定效应中各期时间效应相同。其回归结果如下,时间趋势项强烈显著。

(9)加入时间虚拟变量的LSDV法假设双向固定效应中各期时间效应不同。由于不存在同一年份下各州均相等的解释变量,所以回归前无需剔除。回归结果表示,在10%的显著性水平下,17年中有5年的时间效应不显著,其余12年显著。

(10)FD法的估计结果如下,lnk1系数变为正,并在5%显著性水平下显著。

(11)通过前面的检验可以认为不存在个体随机效应,所以本题应优先使用固定效应模型,而估计组间估计量是随机效应模型的方法,所以从逻辑上讲是不可靠的。回归结果如下。

最后,使用esttab比较各回归方法的估计值和显著性。
全部进行回归并存储回归结果。


为节省空间,使用keep()选项规定只显示解释变量,不显示两种LSDV中的虚拟变量回归系数的估计值。全放在一起表格太宽,分两组进行展示。
第一组:(1)混合回归 (2)组内估计量 (3)使用聚类稳健标准误的组内估计量 (4)带有时间趋势变量的组内估计量(假定各期时间效应相同的双向固定效应模型) (5)一阶差分法(估计量不同所以为空)

第二组:(1)使用LSDV法的单向固定效应模型 (2)使用LSDV法的双向固定模型(各期时间效应不同) (3)使用FGLS法的随机效应模型 (4)极大似然估计量 (5)组间估计量


关于各回归方法的总结,可以参考这篇专栏。
