互助问答第30期:工具变量、GARCH模型操作和多项选择效信度

问题1:用截面数据研究var1对y1 与y2 的影响,由于y1是0-1型的变量、y2为连续变量,因此分别用probit与tobit模型做了回归,首先做了基础回归,之后做了工具变量回归,但工具变量回归的结果(系数的绝对值)却远远大于原回归系数的绝对值,|-2.006|>|-0.046|,为何工具变量回归后系数比原来大了这么多,出现这种情况的原因是什么?应该怎么办?是我的工具变量选取的问题吗?还是别的原因?

回答1:
首先第一个问题,IV-Probit 和Probit的系数是不能直接比的,因为二元选择模型涉及到normalize,两者的系数之间差了一个倍数。如果真的要比,建议比较(average)partial effects或者partial effects on average。
其次,本身使用工具变量后,由于可用的variation少了,所以方差会更大,结果也会倾向于不稳定。特别是当工具很弱的时候,结果会非常不稳定。你的第一阶段虽然工具变量很显著,不过没有汇报F值之类的,所以也不知道是不是因为工具变量太弱。
最后,也有可能本来效应就有这么大,说不准。
问题2:(1)对于均值方程ARMA,如果自相关图看不出滞后阶数,如何确定滞后阶数?(2)加入虚拟变量的GARCH模型在Eviews中如何操作?
答案2:
(1)所有的ARMA模型,不建议使用自相关图、偏自相关图确定阶数,建议使用AIC、BIC之类的信息准则确定。如果样本量大建议使用BIC,样本量小建议使用AIC,不断的调节q, p的取值,对比他们的adj R2和AIC等指标,选取最佳的。
(2)步骤为:Quick——Estimate Equation,选择GARCH模型。在设置虚拟变量时,如果虚拟变量放在mean equation,则在mean equation字段输入:y y(-1) y(-2) D;如果是在variance equation,则在variance equation输入:D。(PS:D为设置的虚拟变量)
问题3:(1)问卷中问题涉及有分类性质的多项选择,后期的信效度分析难吗?该怎么处理呢?原问题如下:在您决定出境旅游过程中,何时收集相关气候信息? ( )
A. 计划旅行时:选择旅游目的地
B. 计划旅行时:确定出行日期
C. 计划旅行时:安排旅游活动
D. 准备出行前:选择旅游目的地
E. 准备出行前:确定活动时间
F. 准备出行前:安排旅游活动
G. 旅行过程中:安排旅游活动
H. 旅行过程中:确定活动时间
I. 不收集相关的气候信息
(2)针对上述原问题,如果考虑按时间(计划旅行时、准备出行前和旅行过程中)分成几个问题,请问这样提问的效信度分析是不是比原问题容易一些?
答案3:
信效度是对一个事物评价的一致性和有效性,主要是针对量表的。就问卷选择不同的方面来说,不存在是否一致性和有效性的问题。
学术指导:张晓峒老师
本期解答人:慧航 任婉婉老师
编辑:鹏飞 统计小妹
统筹:芋头 易仰楠
技术:知我者
