欢迎光临散文网 会员登陆 & 注册

互助问答第117期:关于double-hurdle模型的问题

2020-05-07 20:27 作者:学术苑  | 我要投稿

您好!我想请教以下三个问题:

1.在估计double-hurdle模型时是不是可以用probit结合truncreg做?

2.是不是需要通过第一个模型估计出逆米尔斯比率,然后再带入第二个模型进行估计?

3.我的数据是在0处断尾,我用probit+truncreg跑了一下模型,在truncreg时设置ll(0)跑不出结果,但是在设置了ul()时,却跑出了结果,这是什么原因造成的?是否与因变量有关系?(因变量共600份样本,其中有400份样本的因变量为0)。

感谢老师百忙之中抽出时间来回答我的问题,谢谢。

Double-hurdle 模型第一步假设研究对象的特征决定他们是否有可能从事某个行为,这是第一层 hurdle;在给定研究对象有可能从事某个行为的基础上,第二步分析研究对象的特征对行为结果的影响。但是,即使研究对象有可能从事某个行为,也不意味着他真的从事了该行为——如果研究对象的特征预测他从事该行为的程度为负,则他实际上就没有从事该行为,这是第二层 hurdle。从 double-hurdle 的模型原义看,它可以是 probit(第一层 hurdle)和 tobit(第二层 hurdle)的结合。举个例子。研究者研究个体消费牛奶的行为。第一层 hurdle研究个体特征如何决定他们是否是牛奶的潜在消费者;给定个体是牛奶潜在消费者,第二层hurdle研究个体特征如何决定他们消费了多少牛奶——但即便个体是潜在的牛奶消费者(越过了第一层hurdle),如果个体特征预测出牛奶消费量为负,则研究对象实际上也没有消费牛奶(因此,第二层本质上是tobit模型)。

但是,double-hurdle模型无法、也没有必要分两步估计。上面的例子中,我们观测到的信息就是牛奶消费量,有的人是0,有的人是正数。但牛奶消费为0的个体可能属于不同情况:第一种情况是他们根本就不是牛奶的潜在消费者;第二种情况是他们是牛奶的潜在消费者,但因为某些特征影响,暂时不消费牛奶。单凭观测到的牛奶消费量,无法区分两种情况,因此也就无法分两步估计两层hurdle。

Double-hurdle的正确估计方法是根据上述两层的逻辑构建极大似然函数,然后利用极大似然法同时估计出各层参数。如果最终的行为结果是连续变量(例如牛奶消费量),则可以下载使用第三方命令dhreg。该命令还有许多变种,比如适用于面板数据double-hurdle模型的xtdhreg和放松分布假设后使用的bootdhreg等。相关命令的使用方法和实例可参见帮助文件,也可参见这些命令的原始论文:

https://journals.sagepub.com/doi/pdf/10.1177/1536867X1401400405


往期回顾:

互助问答第116期:PSM-DID问题补充

互助问答第115期:IV-Probit中二阶段外生变量都要放入一阶段中吗

互助问答第114期:交乘项系数、解释变量滞后一期的面板固定效应等问题

互助问答第113期:关于面板数据的偏差校正LSDV法与全面FGLS法的权衡问题

如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)


如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告


鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!


(欢迎转发,欢迎分享转载请注明出处引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”任何侵权行为将面临追责!)


学术指导:张晓峒老师

本期解答人:中关村大街

统筹:易仰楠

编辑:孙婷婷

技术:林毅


互助问答第117期:关于double-hurdle模型的问题的评论 (共 条)

分享到微博请遵守国家法律