互助问答第239期:关于双重差分以及三重差分中聚类标准误和固定效应的问题
尊敬的老师您好:
想咨询关于双重差分以及三重差分中聚类标准误和固定效应的问题。问题描述如下:
数据样本为微观企业层级面板数据(id),政策冲击发生在省份层面(省份代码以province指代)。
疑问一:请问该种情况下做双重及三重差分回归,标准误应该聚类到id还是province比较合理呢?即如下的(1)和(2)该如何选择呢。

如果(1)比较合理请忽略此问。如果(2)比较合理,由于数量级减少很多,是否还需要进行bootstrap?如下设定:

是否也可以接受呢?
疑问二:在三重差分中(时间-省份-行业),样本同样为微观企业面板数据,省份层面宏观政策冲击。两两固定效应如何设定比较合理呢,标准误应该到聚类到什么层级呢?

设定是否合理呢?
回答一:标准误聚类到某个层级,背后的假设是:1、该层级某个组内部个体之间是相互关联的;2、该层级不同组的个体之间是无关的。如果数据是企业层面的面板数据,标准误聚类到企业层面是最基本的要求,因为对于同一企业来说,它在不同年份之间的观测值必定是有关联的;同时,聚类到企业层面也假设不同企业之间是无关联的。聚类层级越高,则对个体间关联的假设越一般化,越符合现实,但对模型的考验也就越强。例如,聚类到省层面,相当于假设省内所有观测值之间都是相互关联的,只有不同省份的观测值之间才无关联——这比只在企业层级聚类要更一般化。如果聚类到省份-年份层面(province*year),则假设在同一个省且同一年的观测值之间才相互关联,而不同省或者不同年的观测值之间均无关联——在一般性上不如聚类到省份层面。
回答二:在三重差分中,需要控制三个维度变量自己以及三个维度变量的两两交互项。至于聚类到哪个层级,还是跟上面的回答类似:看你怎么假设个体间的关联结构。可以在省份层面聚类,这样即假设省内样本相关联,但省份之间无关联;也可以在行业层面聚类,即假设同一行业内部样本相关联,但不同行业间样本无关联。
往期回顾:
互助问答第230期:工具变量阶数和模型设定问题
互助问答第229期:关于实证分析的一个问题
互助问答第228期:关于共同前沿生产函数模型和方法的问题
互助问答第227期:中介效应Sobel检验和交互项系数是否显著为零的问题
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术苑是以“互助问答”为特色的学术研究公共品提供平台,汇聚国际国内顶尖经管学术大咖、聚焦于实证论文写作与发表,另有文献荐读、一周一荐和相关学术培训等辅助板块,致力于为订阅者提供更为全面的服务。
平台现拟推出全新模块,该模块旨在征集经典外文实证文章的原创翻译,诚挚邀请您为平台赐稿,与我们一同提升学术服务能力,提高平台公众号推文质量。稿件主题主要为与实证研究相关的计量方法和应用,其他相关经济学主题的原创翻译稿件也十分欢迎。
学术指导:张晓峒老师
本期解答人:中关村大街
编辑:孙婷婷
统筹:易仰楠
技术:林毅
